Eu tenho dados coletados de um experimento organizado da seguinte maneira:
Dois locais, cada um com 30 árvores. 15 são tratados, 15 são controle em cada local. De cada árvore, amostramos três pedaços do caule e três pedaços das raízes, de modo que 6 amostras de nível 1 por árvore são representadas por um dos dois níveis de fator (raiz, caule). Então, a partir dessas amostras de caule / raiz, coletamos duas amostras dissecando tecidos diferentes dentro da amostra, o que é representado por um dos dois níveis de fator para o tipo de tecido (tipo de tecido A, tipo de tecido B). Essas amostras são medidas como uma variável contínua. O número total de observações é 720; 2 locais * 30 árvores * (três amostras de caule + três amostras de raiz) * (uma amostra de tecido A + uma amostra de tecido B). Os dados têm esta aparência ...
ï..Site Tree Treatment Organ Sample Tissue Total_Length
1 L LT1 T R 1 Phloem 30
2 L LT1 T R 1 Xylem 28
3 L LT1 T R 2 Phloem 46
4 L LT1 T R 2 Xylem 38
5 L LT1 T R 3 Phloem 103
6 L LT1 T R 3 Xylem 53
7 L LT1 T S 1 Phloem 29
8 L LT1 T S 1 Xylem 21
9 L LT1 T S 2 Phloem 56
10 L LT1 T S 2 Xylem 49
11 L LT1 T S 3 Phloem 41
12 L LT1 T S 3 Xylem 30
Estou tentando ajustar um modelo de efeitos mistos usando R e lme4, mas sou novo em modelos mistos. Gostaria de modelar a resposta como o Tratamento + Fator de nível 1 (tronco, raiz) + Fator de nível 2 (tecido A, tecido B), com efeitos aleatórios para as amostras específicas aninhadas nos dois níveis.
Em R, estou fazendo isso usando o lmer, da seguinte maneira
fit <- lmer(Response ~ Treatment + Organ + Tissue + (1|Tree/Organ/Sample))
Pelo meu entendimento (... o que não é certo e por que estou postando!), O termo:
(1|Tree/Organ/Sample)
Especifica que 'Amostra' está aninhada nas amostras de órgãos, aninhadas na árvore. Esse tipo de aninhamento é relevante / válido? Desculpe se esta questão não está clara. Em caso afirmativo, especifique onde posso elaborar.
Li essa pergunta e a resposta do Dr. Bolker e tentei replicar os dados (sem me importar muito, francamente, com o que "comprimento" representa em termos ou unidades biológicas e depois encaixar o modelo conforme acima. Estou publicando os resultados aqui compartilhar e buscar feedback sobre a provável presença de mal-entendidos.
O código que eu usei para gerar esses dados fictícios pode ser encontrado aqui e o conjunto de dados tem a estrutura interna do OP:
A estrutura é a seguinte:
O conjunto de dados foi "manipulado" (o feedback aqui seria bem-vindo) da seguinte maneira:
treatment
, existe um efeito fixo com duas interceptações distintas para tratamento versus controle (100
versus70
) e sem efeitos aleatórios.tissue
efeitos fixos proeminentes com interceptações muito diferentes paraphloem
versusxylem
(3
versus6
) e efeitos aleatórios com asd = 3
.organ
sd = 3
6
root
stem
tree
temos apenas efeitos aleatórios com asd = 7
.sample
eu tentei configurar apenas efeitos aleatórios comsd = 5
.site
também apenas efeitos aleatórios comsd = 3
.Não houve declives, devido à natureza categórica das variáveis.
Os resultados do modelo de efeitos mistos:
estavam:
Como funcionou:
treatment
a interceptação sem tratamento foi79.8623
(estabeleci uma média de70
), e com o tratamento foi79.8623 + 21.4368 = 101.2991
(estabelecemos uma média de100
.tissue
havia uma3.1820
contribuição para a cortesia de interceptação dexylem
, e eu havia estabelecido uma diferença entrephloem
exylem
de3
. Os efeitos aleatórios não fizeram parte do modelo.organ
, amostras dostem
aumento da interceptação em0.1856
- eu não havia estabelecido diferença nos efeitos fixos entrestem
eroot
. O desvio padrão do que eu queria agir como efeitos aleatórios não foi refletido.tree
efeitos aleatórios com um SD de7
surgiram muito bem como7.027
.sample
, a inicialsd
de5
foi subestimada como3.088
.site
não fazia parte do modelo.Portanto, no geral, parece que o modelo corresponde à estrutura dos dados.
fonte