Eu tenho dados para a população de vários peixes diferentes, amostrados durante um período de cerca de 5 anos, mas em um padrão muito irregular. Às vezes, há meses entre as amostras, às vezes há várias amostras em um mês. Há também muitas contagens 0
Como lidar com esses dados?
Posso fazer gráficos com bastante facilidade em R, mas os gráficos não são particularmente esclarecedores, porque são muito irregulares.
Em termos de modelagem - com espécies modeladas em função de várias coisas - talvez um modelo misto (também conhecido como modelo multinível).
Todas as referências ou idéias são bem-vindas
Alguns detalhes em resposta a comentários
Existem cerca de 15 espécies.
Estou tentando ter uma idéia de qualquer tendência ou sazonalidade em cada peixe e ver como as espécies se relacionam (meu cliente originalmente queria uma tabela simples de correlações)
O objetivo é descritivo e analítico, não preditivo
Edições adicionais: Encontrei este artigo de K. Rehfield et al., Que sugere o uso de núcleos gaussianos para estimar o ACF para séries temporais altamente irregulares
http://www.nonlin-processes-geophys.net/18/389/2011/npg-18-389-2011.pdf
fonte
Respostas:
Passei bastante tempo criando uma estrutura geral para séries temporais com espaçamento desigual: http://www.eckner.com/research.html
Além disso, escrevi um artigo sobre estimativa de tendências e sazonalidades para séries temporais desigualmente espaçadas.
Espero que você encontre os resultados úteis!
fonte
Não sei se um modelo misto é muito apropriado (usando os pacotes padrão em que a estrutura de efeitos aleatórios é um preditor linear), a menos que você pense que os dados em todos os momentos devem ser trocáveis entre si em algum sentido (nesse caso) os intervalos irregulares não são um problema) - não seria realmente modelar a autocorrelação temporal de uma maneira razoável. É possível que você possa induzir lmer () a fazer algum tipo de autogressão, mas como exatamente você faria isso me escapa agora (eu posso não estar pensando direito). Além disso, não tenho certeza de qual seria a "variável de agrupamento" que induz a autocorrelação no cenário do modelo misto.
Se a autocorrelação temporal é um parâmetro incômodo e você não espera que seja muitogrande, você pode agrupar os dados em épocas que são essencialmente separadas entre si em termos de correlação (por exemplo, separar as séries temporais em pontos em que há meses sem dados) e visualizá-las como réplicas independentes. Você poderia fazer algo como um GEE nesse conjunto de dados modificado, em que o "cluster" é definido por qual época você está, e as entradas da matriz de correlação de trabalho são uma função de quão distantes as observações foram feitas. Se sua função de regressão estiver correta, você ainda obterá estimativas consistentes dos coeficientes de regressão, mesmo que a estrutura de correlação seja especificada incorretamente. Isso também permitiria modelá-lo como dados de contagem usando, por exemplo, o link de log (como normalmente faria na regressão de Poisson). Você também pode criar uma correlação diferencial entre espécies, onde cada ponto no tempo é visto como um vetor multivariado de espécies, conta com alguma associação de deterioração temporal entre os pontos no tempo. Isso exigiria algum pré-processamento para induzir os pacotes GEE padrão a fazer isso.
fonte
surveillance
pacote pode ter a funcionalidade desejada. Esse tipo de modelagem não é incomum nos estudos ecológicos, portanto, provavelmente é melhor encontrar um bom pacote nos recantos ecológicos do CRAN.