Design de modelo de efeito misto com uma variável de amostragem

11

Estou tentando especificar uma fórmula para um modelo linear de efeitos mistos (com lme4) para o meu design experimental, mas não tenho certeza se estou fazendo certo.

O design: basicamente estou medindo um parâmetro de resposta nas plantas. Eu tenho 4 níveis de tratamento e 2 níveis de irrigação. As plantas são agrupadas em 16 parcelas, em cada parcela eu amostro 4 subparcelas. Em cada subparcela, faço entre 15 e 30 observações (dependendo do número de plantas encontradas). Ou seja, há um total de 1500 linhas.

insira a descrição da imagem aqui

Inicialmente, o nível de subparcela estava aqui apenas para fins de amostragem, mas pensei em considerá-lo no modelo (como uma variável de 64 níveis) porque vi que havia muita variabilidade de uma subparcela para outra , mesmo dentro do mesmo gráfico (maior que a variabilidade entre gráficos inteiros).

Minha primeira ideia foi escrever:

library(lme4)
fit <- lmer(y ~ treatment*irrigation + (1|subplot/plot), data=mydata)

ou

fit <- lmer(y ~ treatment*irrigation + (1|subplot) + (1|plot), data=mydata)

Isso está correto? Não tenho certeza se devo manter os dois níveis de plot / sub-plot na minha fórmula. Nenhum efeito fixo é significativo, mas os efeitos aleatórios são muito significativos.

agenis
fonte

Respostas:

9

Seu modelo deve ser escrito como

fit <- lmer(y ~ treatment*irrigation + (1|plot/subplot), data=mydata)

como subparcelas são aninhadas no site. embora (1|plot)+ (1|subplot)funcione se as subparcelas tiverem um rótulo exclusivo (ou seja, 1A, 1B, 1C, ..., 2A, 2B, 2C, em vez de A, B, C ..., A, B, C). Meu capítulo de livro de Fox et al. Estatística Ecológica descreve um exemplo de aninhamento:

Por outro lado, no exemplo de carrapato, cada pintinho ocorre em apenas uma ninhada e cada ninhada ocorre em apenas um local: a especificação do modelo é (1 | SITE/BROOD/INDEX)lida como “pintinho (ÍNDICE) aninhado na ninhada aninhada no local” ou equivalente (1 | SITE) + (1 | SITE:BROOD) + (1 | SITE:BROOD:INDEX). Se as ninhadas e os filhotes forem rotulados exclusivamente, para que o software possa detectar o aninhamento, (1 | SITE) + (1 | BROOD) + (1 | INDEX)também funcionará (não use (1 | SITE) + (1 | SITE/BROOD) + (1 | SITE/BROOD/INDEX); isso levará a termos redundantes no modelo).

Outros pensamentos:

  • mais informações sobre aninhamento e especificações de modelo em http://glmm.wikidot.com/faq
  • seus tratamentos de irrigação são realmente organizados como mostrado no esquema acima, ou seja, não intercalados? Ou isso é apenas para conveniência da apresentação gráfica? Se o primeiro, então você tem um projeto experimental potencialmente problemático ...
  • Como as subparcelas são aninhadas nos sites, seria muito bom inferir (seguindo a Murtaugh 2007 Ecology "Simplicidade e complexidade na análise de dados ecológicos" ) pegar as médias da plotagem e analisar os dados no nível da plotagem.
  • Pelo que vale, acho que você poderia ir ainda mais longe e agregar ao nível da trama; então você pode pular modelos mistos completamente e apenas fazerlm(y~treatment*irrigation, data=my_aggregated_data)
Ben Bolker
fonte
obrigado por sua ajuda (tenho 12 horas para esperar para desbloquear o +50 :( na verdade, eu estava em dúvida sobre o nome das minhas subparcelas (4 ou 64 etiquetas exclusivas). A figura está correta: a irrigação não é "aleatória", isso é lamentável, eu concordo (eles me disseram: "muito expansivo para fazer de maneira diferente"!). Obrigado pelos links. Mais uma pergunta: eu recebo um gráfico de resíduos que não parece bom: em forma de cone (como este: "<"), erro parece proporcional aos valores Y se existe uma maneira de corrigir isso neste tipo de modelo.?
agenis
1
A solução mais óbvia (e que geralmente corrige outros problemas) é transformar a resposta, geralmente transformando o log.
Ben Bolker 27/03