Sob quais condições alguém deve considerar o uso de análise multinível / hierárquica em oposição a análises mais básicas / tradicionais (por exemplo, ANOVA, regressão OLS, etc.)? Existem situações em que isso possa ser considerado obrigatório? Existem situações em que o uso de análise multinível / hierárquica é inadequado? Finalmente, quais são alguns bons recursos para iniciantes aprenderem análises hierárquicas / multiníveis?
mixed-model
multilevel-analysis
Patrick
fonte
fonte
Respostas:
Quando a estrutura de seus dados é naturalmente hierárquica ou aninhada, a modelagem multinível é um bom candidato. De um modo mais geral, é um método para modelar interações.
Um exemplo natural é quando seus dados são de uma estrutura organizada, como país, estado, distritos, onde você deseja examinar os efeitos nesses níveis. Outro exemplo em que você pode se encaixar nessa estrutura é a análise longitudinal, na qual você repetiu medições de vários indivíduos ao longo do tempo (por exemplo, alguma resposta biológica a uma dose de medicamento). Um nível do seu modelo assume uma resposta média do grupo para todos os assuntos ao longo do tempo. Outro nível do seu modelo permite perturbações (efeitos aleatórios) da média do grupo, para modelar diferenças individuais.
Um livro popular e bom para começar é a Análise de Dados de Gelman Usando Modelos de Regressão e Multilevel / Hierachical .
fonte
O Center for Multilevel Modeling possui alguns bons tutoriais on-line gratuitos para modelagem em vários níveis e eles têm tutoriais de software para ajustar modelos no software MLwiN e no STATA.
Tome isso como heresia, porque não li mais do que um capítulo do livro, mas modelos lineares hierárquicos: aplicativos e métodos de análise de dados Por Stephen W. Raudenbush, Anthony S. Bryk é altamente recomendado. Também jurei que havia um livro sobre modelagem em vários níveis usando o software R no Springer Use R! série, mas não consigo encontrá-lo no momento (pensei que foi escrito pelas mesmas pessoas que escreveram o livro A Beginner's Guide to R).
editar: O livro sobre o uso de R para modelos de vários níveis é Modelos e Extensões de Efeitos Mistos em Ecologia com R de Zuur, AF, Ieno, EN, Walker, N., Saveliev, AA, Smith, GM
boa sorte
fonte
Aqui está outra perspectiva sobre o uso de modelos multiníveis versus modelos de regressão: Em um artigo interessante de Afshartous e de Leeuw, eles mostram que, se o objetivo da modelagem é preditivo (ou seja, prever novas observações), a escolha do modelo é diferente de quando o objetivo é inferência (onde você tenta combinar o modelo com a estrutura de dados). O artigo a que me refiro é
Afshartous, D., de Leeuw, J. (2005). Previsão em modelos multiníveis. J. Educat. Behav. Statist. 30 (2): 109–139.
Acabei de encontrar outro artigo relacionado desses autores aqui: http://moya.bus.miami.edu/~dafshartous/Afshartous_CIS.pdf
fonte
Com o modelo em mãos, a questão se torna uma estimativa. Se você tem muitas escolas e muitos dados para cada escola, as boas propriedades do OLS (consulte Angrist e Pischke, Mostly Harmless ..., para uma revisão atual) sugira que você queira usá-lo, com ajustes adequados aos erros padrão para contabilizar dependências e usando variáveis e interações fictícias para obter efeitos no nível da escola e interceptações específicas da escola. O OLS pode ser ineficiente, mas é tão transparente que pode ser mais fácil convencer o público cético se você o usar. Porém, se seus dados são escassos de certas maneiras - principalmente se você tiver poucas observações para algumas escolas -, convém impor mais "estrutura" ao problema. Você pode "emprestar força" às escolas de amostra maior para melhorar as estimativas barulhentas que você obteria nas escolas de amostra pequena se a estimativa fosse feita sem estrutura. Em seguida, você pode recorrer a um modelo de efeitos aleatórios estimado via FGLS,
Neste exemplo, o uso de um modelo multinível (no entanto, decidimos ajustá-lo, em última análise) é motivado pelo interesse direto nas interceptações na escola. Obviamente, em outras situações, esses parâmetros no nível do grupo podem ser nada mais do que um incômodo. Se você precisa ou não ajustá-las (e, portanto, ainda trabalha com algum tipo de modelo multinível) depende se certas suposições de exogeneidade condicional são válidas. Sobre isso, eu recomendaria consultar a literatura econométrica sobre métodos de dados em painel; a maioria das informações de lá é transferida para contextos gerais de dados agrupados.
fonte
A modelagem multinível é apropriada, como o nome sugere, quando seus dados têm influências que ocorrem em diferentes níveis (individual, ao longo do tempo, sobre domínios etc.). A modelagem de nível único assume que tudo está ocorrendo no nível mais baixo. Outra coisa que um modelo multinível faz é introduzir correlações entre unidades aninhadas. Portanto, as unidades de nível 1 dentro da mesma unidade de nível 2 serão correlacionadas.
Em certo sentido, você pode pensar na modelagem em vários níveis como encontrar o meio termo entre a "falácia individualista" e a "falácia ecológica". A falácia individualista ocorre quando os "efeitos da comunidade" são ignorados, como a compatibilidade do estilo de um professor com o estilo de aprendizagem de um aluno, por exemplo (presume-se que o efeito venha apenas do indivíduo, faça a regressão no nível 1). enquanto "falácia ecológica" é o contrário, e seria como supor que o melhor professor tivesse os alunos com as melhores notas (e para que o nível 1 não seja necessário, basta fazer a regressão inteiramente no nível 2). Na maioria das situações, nenhum dos dois é apropriado (o aluno-professor é um exemplo "clássico").
fonte
Geralmente, falar uma análise bayesiana hierárquica (HB) levará a estimativas em nível individual eficientes e estáveis, a menos que seus dados sejam tais que os efeitos em nível individual sejam completamente homogêneos (um cenário irreal). As estimativas de eficiência e parâmetros estáveis dos modelos HB tornam-se realmente importantes quando você possui dados esparsos (por exemplo, menos de obs do que o de parâmetros no nível individual) e quando deseja estimar estimativas no nível individual.
No entanto, os modelos HB nem sempre são fáceis de estimar. Portanto, enquanto a análise da HB geralmente supera a análise que não é da HB, é necessário avaliar os custos relativos x benefícios com base na sua experiência passada e nas suas prioridades atuais em termos de tempo e custo.
Dito isto, se você não está interessado em estimativas em nível individual, pode simplesmente estimar um modelo de nível agregado, mas mesmo nesses contextos estimar modelos agregados via HB usando estimativas em nível individual pode fazer muito sentido.
Em resumo, a adaptação de modelos HB é a abordagem recomendada desde que você tenha tempo e paciência para ajustá-los. Você pode usar modelos agregados como referência para avaliar o desempenho do seu modelo HB.
fonte
Aprendi com Snijders e Bosker, Análise multinível: uma introdução à modelagem multinível básica e avançada. Acho que é muito bom para iniciantes, deve ser porque eu sou um grosso no que diz respeito a essas coisas e isso fez sentido para mim.
Eu também segundo Gelman e Hill, um livro verdadeiramente brilhante.
fonte
Modelos multiníveis devem ser empregados quando os dados são aninhados em uma estrutura hierárquica, particularmente quando há diferenças significativas entre as unidades de nível superior na variável dependente (por exemplo, a orientação para o desempenho do aluno varia entre os alunos e também entre as classes com as quais os alunos estão aninhados). Nessas circunstâncias, as observações são agrupadas em vez de independentes. A falha em levar em consideração o agrupamento leva à subestimação dos erros das estimativas de parâmetros, ao teste de significância tendenciosa e à tendência de rejeitar o nulo quando ele deve ser retido. A justificativa para o uso de modelos multiníveis, bem como explicações completas sobre como realizar as análises, é fornecida por
Raudenbush, SW Bryk, AS (2002). Modelos lineares hierárquicos: aplicações e métodos de análise de dados. 2ª edição. Newbury Park, CA: Sábio.
O livro R & B também está bem integrado ao pacote de software HLM dos autores, o que ajuda bastante no aprendizado do pacote. Uma explicação de por que os modelos multiníveis são necessários e preferíveis a algumas alternativas (como codificação fictícia das unidades de nível superior) é fornecida em um artigo clássico
Hoffman, DA (1997). Uma visão geral da lógica e da lógica dos modelos lineares hierárquicos. Journal of Management, 23, 723-744.
O documento da Hoffman pode ser baixado gratuitamente se você pesquisar no Google "Hoffman 1997 HLM" e acessar o pdf online.
fonte