Estou procurando conselhos sobre como analisar dados complexos de pesquisas com modelos multiníveis em R. Eu usei o survey
pacote para ponderar probabilidades desiguais de seleção em modelos de um nível, mas este pacote não possui funções para modelagem multinível. O lme4
pacote é ótimo para modelagem multinível, mas não sei como incluir pesos em diferentes níveis de cluster. Asparouhov (2006) coloca o problema:
Modelos multiníveis são freqüentemente usados para analisar dados de projetos de amostragem de cluster. No entanto, esses desenhos de amostragem costumam usar probabilidades desiguais de seleção no nível do cluster e no nível individual. Os pesos de amostragem são atribuídos em um ou nos dois níveis para refletir essas probabilidades. Se os pesos amostrais forem ignorados em ambos os níveis, as estimativas dos parâmetros poderão ser substancialmente tendenciosas.
Uma abordagem para modelos de dois níveis é o estimador multinível de verossimilhança pseudo - máxima (MPML) implementado no MPLUS ( Asparouhov et al., ). Carle (2009) revisa os principais pacotes de software e faz algumas recomendações sobre como proceder:
Para conduzir adequadamente o MLM com dados complexos de pesquisa e pesos de projeto, os analistas precisam de um software que inclua pesos dimensionados fora do programa e inclua os "novos" pesos dimensionados sem modificação automática do programa. Atualmente, três dos principais programas de software MLM permitem isso: Mplus (5.2), MLwiN (2.02) e GLLAMM. Infelizmente, nem o HLM nem o SAS podem fazer isso.
West e Galecki (2013) fazem uma revisão mais atualizada e cito detalhadamente a passagem relevante:
Ocasionalmente, os analistas desejam ajustar os LMMs para pesquisar conjuntos de dados coletados de amostras com projetos complexos (ver Heeringa et al, 2010, capítulo 12). Projetos de amostras complexas geralmente são caracterizados pela divisão da população em estratos, seleção em vários estágios de grupos de indivíduos de dentro dos estratos e probabilidades desiguais de seleção para ambos os clusters e os indivíduos finais amostrados. Essas probabilidades desiguais de seleção geralmente levam à construção de pesos amostrais para indivíduos, o que garante uma estimativa imparcial dos parâmetros descritivos quando incorporados em uma análise. Esses pesos podem ser ajustados ainda mais para não responder à pesquisa e calibrados para totais da população conhecidos. Tradicionalmente, os analistas podem considerar uma abordagem baseada em design para incorporar esses recursos complexos de amostragem ao estimar modelos de regressão (Heeringa et al., 2010). Mais recentemente, os estatísticos começaram a explorar abordagens baseadas em modelo para analisar esses dados, usando LMMs para incorporar efeitos fixos de estratos de amostragem e efeitos aleatórios de clusters amostrados.
A principal dificuldade com o desenvolvimento de abordagens baseadas em modelos para analisar esses dados foi a escolha de métodos apropriados para incorporar os pesos amostrais (ver Gelman, 2007 para um resumo dos problemas). Pfeffermann et al. (1998), Asparouhov e Muthen (2006) e Rabe-Hesketh e Skrondal (2006) desenvolveram teoria para estimar modelos multiníveis de maneira a incorporar os pesos da pesquisa e Rabe-Hesketh e Skrondal (2006), Carle (2009) e Heeringa et al. (2010, capítulo 12) apresentaram aplicativos usando os procedimentos atuais de software, mas essa continua sendo uma área ativa da pesquisa estatística. Os procedimentos de software capazes de ajustar os LMMs estão em vários estágios de implementação das abordagens propostas na literatura até agora para incorporar recursos complexos de projeto, e os analistas precisam considerar isso ao ajustar LMMs a dados complexos de pesquisa de amostra. Os analistas interessados em ajustar os LMMs aos dados coletados de pesquisas complexas por amostra serão atraídos para procedimentos capazes de incorporar corretamente os pesos da pesquisa nos procedimentos de estimativa (HLM, MLwiN, Mplus, xtmixed e gllamm), consistente com a literatura presente neste área.
Isso me leva à minha pergunta: alguém tem recomendações de práticas recomendadas para ajustar LMMs a dados complexos de pesquisa em R?
fonte
i've never said it before
a partir deste post em addhealth pode ser interessante .. :(lmer
função nolme4
pacote permite a especificação de umweights
argumento para o processo de ajuste de modelo; portanto, se você tiver pesos de design fixos, poderá incorporá-los a esse argumento. Eu tenho o lado errado do bastão aqui? Existe alguma razão para isso ser inadequado para suas necessidades?Respostas:
Até onde eu sei, você não pode fazer isso no R no momento, se você realmente precisa de um modelo misto (por exemplo, se você se importa com os componentes de variação)
O argumento dos pesos para
lme4::lmer()
não fazer o que você deseja, porquelmer()
interpreta os pesos como pesos de precisão e não como pesos de amostragem. Ao contrário dos modelos lineares lineares e lineares comuns, você nem obtém estimativas de pontos corretas com código que trata os pesos de amostragem como pesos de precisão para um modelo misto.Se você não precisa estimar os componentes de variação e deseja apenas que os recursos multiníveis do modelo obtenham erros padrão corretos, você pode usar
survey::svyglm()
.fonte
O pacote WeMix agora é uma opção, pelo menos para modelos multiníveis lineares e logísticos. Parece muito lento, comparado com a execução desses modelos no Stata ou no MPlus.
fonte