Em uma conferência, ouvi a seguinte declaração:
100 medições para 5 sujeitos fornecem muito menos informações do que 5 medições para 100 sujeitos.
É meio óbvio que isso é verdade, mas eu queria saber como alguém poderia provar isso matematicamente ... Eu acho que um modelo misto linear poderia ser usado. No entanto, eu não sei muito sobre a matemática usada para lmer4
calculá- las (eu apenas corro para LMMs e bmrs
GLMMs :) Você poderia me mostrar um exemplo em que isso é verdade? Eu preferiria uma resposta com algumas fórmulas, do que apenas algum código em R. Sinta-se livre para assumir uma configuração simples, como por exemplo modelo misto linear com interceptações e inclinações aleatórias normalmente distribuídas.
PS: uma resposta baseada em matemática que não envolva LMMs também seria aceitável. Pensei nos LMMs porque eles me pareciam a ferramenta natural para explicar por que menos medidas de mais assuntos são melhores do que mais medidas de poucos assuntos, mas posso estar errado.
Respostas:
A resposta curta é que sua conjectura é verdadeira quando e somente quando há uma correlação intra-classe positiva nos dados . Empiricamente falando, a maioria dos conjuntos de dados agrupados na maioria das vezes mostra uma correlação intra-classe positiva, o que significa que, na prática, sua conjectura é geralmente verdadeira. Mas se a correlação intra-classe for 0, os dois casos mencionados são igualmente informativos. E se a correlação intra-classe for negativa , será menos informativo fazer menos medições em mais assuntos; na verdade, preferimos (no que diz respeito à redução da variação da estimativa de parâmetros) fazer todas as nossas medições em um único assunto.
Estatisticamente, há duas perspectivas a partir do qual podemos pensar sobre isso: um de efeitos aleatórios (ou mista ) modelo , que você menciona na sua pergunta, ou um modelo marginal , o que acaba sendo um pouco mais informativo aqui.
Modelo de efeitos aleatórios (misto)
Digamos que temos um conjunto de assuntos dos quais fizemos m medições cada. Em seguida, um modelo de efeitos aleatórios simples do j th medição do i th sujeito pode ser y i j = β + u i + e i j , onde β é a intercepção fixo, u i é o efeito sujeito aleatório (com variância σ 2 u ), e i j é o termo de erro no nível de observação (com variação σ 2 en m j i
Nesse modelo, representa a média da população e, com um conjunto de dados equilibrado (ou seja, um número igual de medidas de cada sujeito), nossa melhor estimativa é simplesmente a média da amostra. Portanto, se tomarmos "mais informações" para significar uma variação menor para essa estimativa, basicamente queremos saber como a variação da média da amostra depende de n e m . Com um pouco de álgebra, podemos descobrir que var ( 1β n m
Examinando essa expressão, podemos ver quesemprequehouver qualquer variação de assunto(ou seja,σ2u>0), aumentar o número de sujeitos (n) tornará esses dois termos menores, enquanto aumenta o número de medições por sujeito (m) apenas tornará o segundo termo menor. (Para uma implicação prática disso na criação de projetos de replicação para vários sites, consulteesta postagem do blog que escrevi há pouco tempo.)
Agora você queria saber o que acontece quando aumentamos ou diminuímos ou n , mantendo constante o número total de observações. Portanto, para isso, consideramos n m uma constante, de modo que toda a expressão de variação se pareça com σ 2 um n nm
que é o menor possível quandoné o maior possível (até um máximo den=nm, nesse casom=1, o que significa que fazemos uma única medição de cada sujeito).
Minha resposta curta se refere à correlação intra-classe, então onde isso se encaixa? Neste modelo simples de efeitos aleatórios, a correlação intra-classe é (esboço de uma derivaçãoaqui). Então, podemos escrever a equação de variância acima como var(1
No contexto do modelo de efeitos aleatórios, uma correlação intra-classe negativa realmente não faz sentido, porque implica que a variação de assunto é de alguma forma negativa (como podemos ver na equação ρ acima e como explicada aqui e aqui ) ... mas as variações não podem ser negativas! Mas isso não significa que o conceito de correlação intra-classe negativa não faça sentido; significa apenas que o modelo de efeitos aleatórios não tem como expressar esse conceito, que é uma falha do modelo, não do conceito. Para expressar esse conceito adequadamente, precisamos considerar o modelo marginal.σ2u ρ
Modelo marginal
Então agora, quando olhamos para a equação para a variância da média da amostra no modelo marginal, temos
(BTW, just a quick aside to point out that the second-to-last line of the derivation above implies that we must haveρ≥−1/(m−1) , or else the whole equation is negative, but variances can't be negative! So there is a lower bound on the intra-class correlation that depends on how many measurements we have per cluster. For m=2 (i.e., we measure each subject twice), the intra-class correlation can go all the way down to ρ = - 1 ; param = 3 só pode descer para ρ = - 1 / 2 ; e assim por diante. Fato engraçado!)
Então, finalmente, mais uma vez considerando o número total de observaçõesn m para ser uma constante, vemos que a penúltima linha da derivação acima se parece com
fonte