Quando incluir um efeito aleatório em um modelo

9

Eu sou novo na modelagem mista e estou confuso sobre se é apropriado usar um efeito aleatório na análise que estou fazendo. Qualquer conselho seria apreciado.

meu estudo está testando até que ponto um índice recém-desenvolvido de abundância de mamíferos pode prever o valor de um índice estabelecido, mas mais trabalhoso. Eu tenho medido esses índices em várias áreas florestais, com várias parcelas em cada área florestal.

porque não estou diretamente interessado no efeito dos fragmentos florestais e porque minhas parcelas de amostra estão aninhadas nos fragmentos florestais, tenho usado o fragmento florestal como um efeito aleatório. No entanto, tenho algumas perguntas sobre isso:

primeiro, eu sei que efeitos aleatórios permitem generalizar seus resultados em todos os níveis possíveis do fator aleatório, não apenas nos que você amostrou. mas parece-me que, para fazer esse tipo de inferência, seus níveis teriam que ser amostrados aleatoriamente? Minhas manchas na floresta não foram amostradas aleatoriamente, então ainda posso usá-las como efeito aleatório?

segundo, li que você pode testar se é necessário ter um efeito aleatório fazendo, por exemplo, um teste de razão de verossimilhança para comparar modelos com e sem o efeito. Eu fiz isso e sugere que o modelo de efeito aleatório não explica os dados, bem como um modelo apenas de efeitos fixos. meu problema com isso é que minhas parcelas ainda estão aninhadas nas áreas de floresta e, portanto, presumivelmente não são independentes. então, posso usar essa abordagem LRT para justificar a exclusão do efeito aleatório ou ainda preciso incluí-la para dar conta do aninhamento? e se eu acabar removendo o efeito aleatório, existe uma maneira de verificar se as parcelas dentro dos fragmentos de floresta podem ser consideradas independentes?

Obrigado pela ajuda!

Jay

Jay
fonte
Penso que a principal coisa conceitual com efeitos aleatórios é que todos devem ter aproximadamente a mesma magnitude e serem intercambiáveis ​​- é isso que torna possível a inferência sobre efeitos aleatórios não amostrados. Além disso, você deve ter cuidado ao usar testes LR para efeitos aleatórios, pois pode haver incerteza considerável em relação ao componente de variação, mesmo se a estimativa de ML / REML for zero ou próximo de zero.
probabilityislogic
Muito obrigado por isso. Então, haveria alguma maneira de descobrir se é necessário manter o efeito aleatório?
jay
Pelo que entendi, é melhor não fazer comparações LR com modelos adequados ao REML. No Imer do R, por exemplo, você deve definir REML = FALSE ao executar o LRT. (O padrão é verdadeiro, o que é de outro modo melhor.)
Wayne

Respostas:

6

Pelo que entendi, você tem um design observacional aninhado simples (plotagens dentro de patches) e seu interesse é em uma correlação / regressão entre duas variáveis ​​contínuas (os dois índices). O tamanho da sua amostra é de m patches xn plots = N pares de observações (ou o sumatório apropriado se desequilibrado). Nenhuma randomização adequada foi envolvida, mas talvez você deva / deva considerar que (1) as amostras foram "aleatoriamente" selecionadas de todas as amostras desse tipo ou em alguma área e, em seguida, (2) as parcelas foram "aleatoriamente" selecionado dentro de cada patch.

Se você ignorar o fator aleatório Patch, poderá pseudo-replicar considerando que selecionou N plotagens aleatoriamente "livremente", sem restringi-las a serem (em número ou tipo) nesses (anteriormente) patches selecionados.

Então, sua primeira pergunta: sim, é isso que um fator aleatório permite. A validade dessa inferência depende da validade da suposição de que a seleção aleatória é equivalente à seleção aleatória de amostras (por exemplo, que seus resultados não seriam diferentes se um conjunto diferente de amostras de floresta fosse selecionado). Isso também limita o seu espaço de inferência: o tipo de floresta ou área geográfica até a qual seus resultados se estendem depende da população máxima (imaginária) de amostras de onde sua amostra é uma amostra "aleatória" credível. Talvez suas observações sejam uma amostra "aleatória razoável" dos mamíferos das áreas florestais de sua região, mas seriam uma amostra suspeita de agregados dos mamíferos de todo o continente.

A segunda: o teste dependerá do "grau de pseudo-replicação" ou da evidência em sua amostra de que as plotagens "pertencem" aos patches. Ou seja, quanta variação existe entre os remendos e entre os lotes dentro dos remendos (procure correlação intraclasse). Em extremo, apenas a variação entre os patches está presente (os gráficos dentro de um patch são todos iguais) e você tem "pseudo-replicação pura": seu N deve ser o número de patches e a amostragem de um ou muitos gráficos de cada um deles não fornece nova informação. Por outro lado, toda variação ocorre entre parcelas, e não há variação extra explicada por saber a que área de floresta cada parcela pertence (e então o modelo sem o fator aleatório pareceria mais parcimonioso); você tem parcelas "independentes". É provável que NENHUM dos extremos ocorra ... particularmente para variáveis ​​biológicas observadas no solo, mesmo que apenas por causa da autocorrelação espacial e da distribuição geográfica dos mamíferos. Pessoalmente, prefiro manter os fatores projetados de qualquer maneira (por exemplo, mesmo quando os patches não são uma fonte relevante de variação NESTA AMOSTRA) para sustentar a analogia "observacional-experimental" explicada acima; lembre-se: não ter evidências em sua amostra para rejeitar a hipótese nula de que a variação entre os fragmentos é zero, não significa que a variação seja zero na população. mesmo quando os patches não são uma fonte relevante de variação NESTA AMOSTRA) para sustentar a analogia "observacional-experimental" explicada acima; lembre-se: não ter evidências em sua amostra para rejeitar a hipótese nula de que a variação entre os fragmentos é zero, não significa que a variação seja zero na população. mesmo quando os patches não são uma fonte relevante de variação NESTA AMOSTRA) para sustentar a analogia "observacional-experimental" explicada acima; lembre-se: não ter evidências em sua amostra para rejeitar a hipótese nula de que a variação entre os fragmentos é zero, não significa que a variação seja zero na população.

FairMiles
fonte