Erros padrão em cluster vs. modelagem multinível?

18

Percorri vários livros (Raudenbush & Bryk, Snijders & Bosker, Gelman & Hill, etc.) e vários artigos (Gelman, Jusko, Primo & Jacobsmeier, etc.), e ainda não entendi direito as principais diferenças entre o uso de erros padrão em cluster versam a modelagem multinível.

Eu entendo as partes que têm a ver com a questão da pesquisa em questão; existem certos tipos de respostas que você só pode obter da modelagem multinível. No entanto, por exemplo, para um modelo de dois níveis em que seus coeficientes de interesse estão apenas no segundo nível, qual é a vantagem de fazer um método sobre o outro? Nesse caso, não estou preocupado em fazer previsões ou extrair coeficientes individuais para clusters.

A principal diferença que pude encontrar é que os erros padrão em cluster sofrem quando os clusters têm tamanhos de amostra desiguais e que a modelagem multinível é fraca, pois assume uma especificação da distribuição aleatória do coeficiente (enquanto o uso de erros padrão em cluster é livre de modelo) .

E, no final, tudo isso significa que, para modelos que poderiam usar ostensivamente qualquer um dos métodos, deveríamos obter resultados semelhantes em termos de coeficientes e erros padrão?

Quaisquer respostas ou recursos úteis serão muito apreciados.

RickyB
fonte
6
O usuário Stask tem uma boa resposta para exatamente essa pergunta .
Andy W
Obrigado. Eu li isso antes, o que realmente me deixou mais cético em relação aos benefícios reais. No entanto, acho que a verdadeira motivação por trás da minha pergunta é verificar se sou validado ao pensar que não é excessivamente útil se estiver apenas olhando para os coeficientes do nível dois como sendo de interesse. Além disso, talvez eu tenha esquecido, mas não acho que esse post tenha abordado se esses dois métodos devem produzir resultados semelhantes (quando as suposições de ambos os métodos são atendidas).
RickyB
1
Com "coeficientes no segundo nível", você quer dizer o nível em que os parâmetros do primeiro estágio são variáveis ​​dependentes?
sheß
Sim, é isso que eu quero dizer.
RickyB 18/09/2015

Respostas:

1

Esta postagem baseia-se em experiências pessoais que podem ser específicas para os meus dados, então não tenho certeza se eles se qualificam como resposta.

Sugiro usar simulações, se possível, para avaliar qual método funciona melhor para seus dados. Fiz isso e fiquei surpreso ao descobrir que os testes (referentes aos parâmetros no primeiro nível) baseados na modelagem multinível estavam superando qualquer outro método (em termos de potência), mantendo o tamanho mesmo em amostras pequenas com poucos "clusters" desiguais. Ainda estou para encontrar um artigo que defenda esse ponto e, pelo que vejo, esse não é realmente um tópico de nicho e merece mais atenção. Eu acho que é bastante pouco pesquisado como os diferentes métodos se comparam à amostra finita ou a poucos / agrupamentos desiguais.

sheß
fonte
Obrigado pelo seu comentário. Você tem algum documento onde registrou seus resultados? Eu ficaria muito interessado em analisá-lo e ver o que você encontrou (e, é claro, eu não citaria, compartilharia ou melhoraria sem discuti-lo com você).
RickyB 18/09/2015