Eu tenho um conjunto de dados composto de proporções que medem o "nível de atividade" de girinos individuais, tornando os valores vinculados entre 0 e 1. Esses dados foram coletados contando o número de vezes que o indivíduo se moveu dentro de um determinado intervalo de tempo (1 para movimento, 0 para nenhum movimento) e, em seguida, calcula a média para criar um valor por indivíduo. Meu principal efeito fixo seria "nível de densidade".
A questão que estou enfrentando é que tenho uma variável fator, "lagoa" que gostaria de incluir como efeito aleatório - não me importo com diferenças entre lagoas, mas gostaria de explicá-las estatisticamente. Um ponto importante sobre as lagoas é que eu tenho apenas três delas e entendo que é ideal ter mais níveis de fator (5+) ao lidar com efeitos aleatórios.
Se for possível, gostaria de alguns conselhos sobre como implementar um modelo misto usando betareg()
ou betamix()
em R. Li os arquivos de ajuda do R, mas geralmente os acho difíceis de entender (o que cada parâmetro de argumento realmente significa no contexto dos meus próprios dados E o que os valores de saída significam em termos ecológicos) e, portanto, tenho a tendência de trabalhar melhor com exemplos.
Em uma nota relacionada, fiquei pensando se, em vez disso, posso usar um glm()
sob uma família binomial e um link de logit para realizar a contabilização de efeitos aleatórios com esse tipo de dados.
Respostas:
Os recursos atuais de
betareg
não incluem efeitos aleatórios / mistos. Embetareg()
só podem incluir efeito fixo, por exemplo, para o seu variável lagoa de três níveis. Abetamix()
função implementa uma regressão beta de mistura finita , não uma regressão beta de efeitos mistos .No seu caso, primeiro tentaria ver qual o efeito de um fator de lagoa fixo. Isso "custa" dois graus de liberdade, enquanto um efeito aleatório seria um pouco mais barato com apenas um grau adicional de liberdade. Mas ficaria surpreso se as duas abordagens levassem a insights qualitativos muito diferentes.
Finalmente, embora
glm()
não suporte a regressão beta, mas nomgcv
pacote há abetar()
família que pode ser usada com agam()
função.fonte
betareg
com efeitos fixos, transformados em logitlmer
com efeitos aleatórios egam
combetar
. (E também: Se a resposta foi útil, considere upvoting ou aceitá-lo.)O pacote glmmTMB pode ser útil para qualquer pessoa com uma pergunta semelhante. Por exemplo, se você quisesse incluir o pond da pergunta acima como um efeito aleatório, o código a seguir faria o seguinte:
fonte
Isso começou como um comentário, mas demorou muito. Eu não acho que um modelo de efeitos aleatórios seja apropriado aqui. Existem apenas três lagoas - você deseja estimar uma variação de 3 números? É isso que acontece com um modelo de efeitos aleatórios. Suponho que as lagoas foram escolhidas em razão de sua conveniência para o pesquisador, e não como uma amostra aleatória de "Lagoas das Américas".
A vantagem de um modelo de efeitos aleatórios é que ele permite que você construa um intervalo de confiança na resposta (nível de atividade) que leva em consideração a variação lagoa a lagoa. Um modelo de efeitos fixos - em outras palavras, tratar a lagoa como um bloco - ajusta a resposta para o efeito da lagoa. Se houve algum efeito adicional do tratamento - digamos, duas espécies de sapo em cada lago - o bloqueio reduz o erro quadrático médio (denominador do teste F) e permite que o efeito do tratamento brilhe.
Neste exemplo, não há efeito de tratamento e o número de lagoas é muito pequeno para um modelo de efeitos aleatórios (e provavelmente "não aleatório"), portanto, não tenho certeza de que conclusões podem ser tiradas deste estudo. Pode-se obter uma boa estimativa da diferença entre as lagoas, mas é isso. Não vejo inferências sendo atraídas para a população mais ampla de sapos em outros locais da lagoa. Alguém poderia enquadrá-lo como um estudo piloto, suponho.
Lembre-se de que qualquer uso de um modelo de efeitos aleatórios aqui fornecerá uma estimativa não confiável para a variação da lagoa e deve ser usado com cuidado.
Mas, quanto à sua pergunta original - isso não é mais um problema de taxa? A distribuição de entrada para eventos por unidade de tempo é o Poisson. Assim, você pode fazer a regressão de Poisson usando as contagens com o intervalo de tempo como um deslocamento.
fonte