coex_st R Documentation Coexistência espaço-temporal de linhagens no registro fóssil Descrição: Cria uma série temporal de determinação de coexistência linhagens do registro fóssil, no espaço e no tempo Uso: coex_st(df, time.series = 1, space = "polygon", plot.longs = F) Argumentos: df data.frame com as ocorrências fósseis do grupo de interesse. time.series define o vetor de série temporal a ser utilizado. Pode ser fornecido um único valor, que define a frequência com que o tempo será dividido, e.g.: time.series = 1 define que o tempo será dividido de 1 em 1 milhão de anos. Também pode ser fornecido o vetor com a série temporal definida, e.g.: time.series <- c(37.8,33.9,27.82,23.03, 20.44, 15.97,13.82,11.63,7.246,5.333,3.6,2.58,1.8,0.781,0.126,0.0117,0); nesse caso a função utilizará esses momentos no tempo para a construção da série temporal space determina o método de coexistência espacial a ser utilizado. Aceita apenas três opções: "site", "coords", "polygon". Veja detalhes para a descrição dos métodos. Default = "polygon" plot.longs lógico, default FALSE. Se TRUE, retorna um gráfico com as longevidades das linhagens e os momentos da série temporal Detalhes: #Conjunto de dados O conjunto de dados deve ser fornecido exatamente como o proposto, com as colunas: "taxon_name", "collection_no", "lng", "lat", "max_ma", "min_ma", similar ao modelo como as ocorrências fósseis são descritas pela base de dados "Paleobiology Database", banco de dados referência mundial de coleções fósseis. O modelo sugerido pressupõe que as ocorrências estejam associadas a um intervalo de tempo estratigráfico (max_ma, min_ma), um identificador de coleção (collection_no), e coordenadas geográficas (lng, lat). A coleção refere-se à assembléia fóssil que cada ocorrência foi encontrada, enquanto que os identificadores de coordenada geralmente estão associados ao sítio fossilífero, ou à localidade geopolítica associada com o sítio fossilífero. Essa diferença discrimina fósseis que são encontrados explicitamente juntos, na mesma camada estratigráfica, e mesmo horizonte fossilífero (collection), enquanto que as coordenadas indicam uma região associada, não necessariamente fósseis com a mesma localidade são encontrados no mesmo horizonte fossilífero, muito menos na mesma assembléia. # Longevidade A longevidade real das linhagens é estimada com o método de intervalos de confiança de Marshall (1990), baseando-se no pressuposto de "range-through" (Foote 2007), em que assume-se que o táxon esteve presente desde o momento de sua ocorrência mais antiga à ocorrência mais recente. O método de Marshall calcula os intervalos de confiança de 50% do momento real de surgimento/extinção em torno do valor observado de uma leitura direta do registro fóssil (ocorrência mais antiga ou mais recente). Esse estimador é um estimador não-enviesado dos momentos de surgimento/extinção baseado no número de ocorrências conhecidadas para aquele táxon, mas depende de uma série de premissas, como potencial de fossilização aleatório, e amostragem constante do registro fóssil do grupo de interesse. Entretanto, o método é robusto o suficiente a violações dessas premissas para a maioria dos casos Marshall 2010). # Coexistência temporal A coexistência no tempo é definida com base no mesmo pressuposto de "range-through": se a longevidade de dois táxons se sobrepõem no mesmo momento de tempo, considera-se que os dois táxons estavam vivos no mesmo momento de tempo. # Coexistência espacial A coexistência espacial pode ser definida de 3 formas diferentes, com diferentes graus de permissividade. Esses diferentes graus refletem a confiança que o usuário pode ter na evidência de coexistência espacial, indo do mais restritivo ao mais abrangente. O primeiro grau, definido com o método "site", define que apenas táxons que possuem ocorrências fósseis encontradas na mesma assembléia, isto é, juntos, sejam considerados co-ocorrentes. Esta é a evidência mais direta de coexistência. Entretanto, relaxando-se essa premissa, no segundo grau, "coords", as ocorrências não necessariamente precisam ser encontradas juntas, mas sim estarem associadas às mesmas coordenadas geográficas. O terceiro grau, "polygon", permite que o usuário reconstrua áreas de vida dos táxons extintos a partir do método de mínimos polígonos convexos, que é considerado bastante confiável para o registro fóssil (Darroch & Saupe 2018). Táxons cujos polígonos se sobrepõem serão considerados como co-ocorrentes. O método utilizado também permite que táxons em que não é possível construir polígonos (com menos que 3 pontos de ocorrência geográfica) também sejam sobrepostos, e.g., se um táxon possui apenas um ponto de ocorrência, mas está dentro da aréa de um polígono de outro táxon, ambos coexistem. # Multiplicação de matrizes As matrizes de coexistência temporal e espacial guardam a informação binária de coexistência, cada uma em uma dimensão. A multiplicação vetorial garante que apenas há coexistência de fato, quando há coexistência nas duas dimensões, i.e.: 0 * 1 = 0, 0 * 0 = 0, 1 * 1 = 1. Valor: lista com n matrizes de série temporal, para cada momento de tempo. Cada matriz possui os nomes da linhas e colunas com os nomes dos táxons do grupo de interesse, preenchida com '1' para as combinações par a par de táxons coexistentes no tempo e no espaço. Aviso: Os pacotes "plyr", "tidyverse", "rgeos" e "rgdal", são necessários para a manipulação dos dados e operações subsequentes. A função carrega automaticamente os pacotes, mas eles devem ser instalados pelo usuário. A qualidade taxonômica dos dados de entrada também deve ser observada. O usuário pode estar interessado em utilizar apenas espécies, apenas gêneros ou qualquer outro nível taxonômico, e, portanto, as entradas do conjunto de dados devem ser consistentes, i.e., no mesmo nível taxonômico. Nota: Da forma como a função foi implementada, ela calcula os polígonos de distribuição dos táxons utilizando-se todas as ocorrências, assumindo uma área constante durante a longevidade do táxon. Isso não necessariamente reflete a realidade, pois a área de distribuição de um táxon pode mudar ao longo do tempo. Uma abordagem mais próxima da realidade seria construir os polígonos para momentos de diferentes do tempo, porém isso necessita um conhecimento mais preciso sobre a real qualidade do registro e a incerteza associada à cada ocorrência do conjunto de dados, pois cada ocorrência precisa ser alocada à um intervalo estratigráfico de interesse. Autor (es): Rodolfo Pereira Graciotti rodolfo.graciotti@gmail.com Referências: Marshall, Charles R. "Confidence intervals on stratigraphic ranges." Paleobiology 16.1 (1990): 1-10. Marshall, Charles R. "Using confidence intervals to quantify the uncertainty in the end-points of stratigraphic ranges." The Paleontological Society Papers 16 (2010): 291-316. Foote, Michael, et al. Principles of paleontology. Macmillan, 2007. https://paleobiodb.org/#/ Darroch, Simon AF, and Erin E. Saupe. "Reconstructing geographic range-size dynamics from fossil data." Paleobiology 44.1 (2018): 25-39. Exemplo: # lendo o data.frame de exemplo can <- read.csv("canidae_data_frame.csv", header = T) # importa o data.frame de # exemplo, apenas com espécies de Canidae names(can) # conferindo se os nomes batem com o proposto db.site.1 <- coex_st(df = can, time.series = 1, space = "site", plot.longs = T) # aplica a função com um vetor de 1 milhão de anos, space como "site" db.coord.1 <- coex_st(df = can, time.series = 1, space = "coords", plot.longs = T) # aplica a função com um vetor de 1 milhão de anos, space como "coords" db.poly.1 <- coex_st(df = can, time.series = 1, space = "polygon", plot.longs = T) # aplica a função com um vetor de 1 milhão de anos, space como "polygon" db.site.v <- coex_st(df = can, time.series = c(37.2,33.9,33.3,30.8,20.43,15.97,13.6,10.3,4.9,1.8,0.3,0.0117,0), space = "site", plot.longs = T) # aplica a função com um vetor específico, space como "site" db.coord.v <- coex_st(df = can, time.series = c(37.2,33.9,33.3,30.8,20.43,15.97,13.6,10.3,4.9,1.8,0.3,0.0117,0), space = "coords", plot.longs = T) # aplica a função com um vetor específico, space como "coords" db.poly.v <- coex_st(df = can, time.series = c(37.2,33.9,33.3,30.8,20.43,15.97,13.6,10.3,4.9,1.8,0.3,0.0117,0), space = "polygon", plot.longs = T) # aplica a função com um vetor específico, space "polygon" # caso a premissa de que os graus de coexistência espacial aumentam a permissividade # da co-ocorrência, ao comparar o resultado dos diferentes métodos com o mesmo conjunto # de dados e tempo, espera-se que o número absoluto de instâncias em que há # co-ocorrência deva ser: site < coords < polygon sum(sapply(db.site.1, sum)) sum(sapply(db.coord.1, sum)) sum(sapply(db.poly.1, sum)) sum(sapply(db.site.v, sum)) sum(sapply(db.coord.v, sum)) sum(sapply(db.poly.v, sum))