Na literatura sobre modelos hierárquicos / multiníveis, eu sempre li sobre "modelos aninhados" e "modelos não aninhados", mas o que isso significa? Alguém poderia me dar alguns exemplos ou me contar sobre as implicações matemáticas desse fraseado?
61
Respostas:
Aninhado versus não aninhado pode significar muitas coisas. Você aninhou projetos versus projetos cruzados (consulte, por exemplo, esta explicação ). Você aninhou modelos na comparação de modelos. Aninhado significa aqui que todos os termos de um modelo menor ocorrem em um modelo maior. Essa é uma condição necessária para o uso da maioria dos testes de comparação de modelos, como testes de razão de verossimilhança.
No contexto de modelos multiníveis, acho melhor falar de fatores aninhados e não aninhados. A diferença está em como os diferentes fatores estão relacionados entre si. Em um design aninhado, os níveis de um fator só fazem sentido dentro dos níveis de outro fator.
Digamos que você queira medir a produção de oxigênio das folhas. Você experimenta várias espécies de árvores e, em todas as árvores, algumas folhas no fundo, no meio e no topo da árvore. Este é um design aninhado. A diferença de folhas em uma posição diferente só faz sentido dentro de uma espécie de árvore. Portanto, comparar as folhas de baixo, as do meio e as de cima sobre todas as árvores não faz sentido. Ou dito de outra maneira: a posição da folha não deve ser modelada como efeito principal.
Fatores não aninhados é uma combinação de dois fatores que não estão relacionados. Digamos que você estude pacientes e esteja interessado na diferença de idade e sexo. Então você tem uma classe de fator e um fator de sexo que não estão relacionados. Você deve modelar idade e sexo como efeito principal e, se necessário, pode dar uma olhada na interação.
A diferença nem sempre é clara. Se no meu primeiro exemplo as espécies arbóreas estão intimamente relacionadas em forma e fisiologia, você pode considerar a posição das folhas também como um efeito principal válido. Em muitos casos, a escolha de um design aninhado versus um design não aninhado é mais uma decisão do pesquisador do que um fato real.
fonte
Os modelos aninhados vs não aninhados aparecem na análise conjunta e no IIA . Considere o "problema do barramento vermelho do barramento azul". Você tem uma população em que 50% das pessoas pegam um carro para trabalhar e os outros 50% pegam o ônibus vermelho. O que acontece se você adicionar um barramento azul com as mesmas especificações do barramento vermelho à equação? Um modelo de logit multinomial preverá 33% de participação nos três modos. Intuitivamente, sabemos que isso não está correto, pois o ônibus vermelho e o ônibus azul são mais parecidos entre si do que com o carro e, portanto, terão mais compartilhamento um do outro antes de compartilhar o carro. É aí que entra uma estrutura de aninhamento, que normalmente é especificada como um coeficiente lambda nas alternativas semelhantes.
Ben Akiva reuniu um bom conjunto de slides descrevendo a teoria sobre isso aqui . Ele começa a falar sobre logit aninhado no slide 23.
fonte
A principal implicação se dois modelos são aninhados é que é relativamente fácil compará-los estatisticamente. Simplificando, com modelos aninhados, você pode considerar o mais complexo como sendo construído adicionando algo a um "modelo nulo" mais simples. Para selecionar o melhor desses dois modelos, portanto, basta descobrir se isso adicionou algo que explica uma quantidade significativa de variação adicional nos dados. Esse cenário é realmente equivalente a ajustar o modelo simples primeiro e remover sua variação prevista dos dados e, em seguida, ajustar o componente adicional do modelo mais complexo aos resíduos do primeiro ajuste (pelo menos com estimativa de mínimos quadrados).
Modelos não aninhados podem explicar porções de variação completamente diferentes nos dados. Um modelo complexo pode até explicar menos variação do que um simples, se o complexo não incluir as "coisas certas" que o simples possui. Portanto, nesse caso, é um pouco mais difícil prever o que aconteceria sob a hipótese nula de que ambos os modelos explicam os dados igualmente bem.
Mais exatamente, sob a hipótese nula (e dadas certas suposições moderadas), a diferença na qualidade do ajuste entre dois modelos aninhados segue uma distribuição conhecida, cuja forma depende apenas da diferença nos graus de liberdade entre os dois modelos. Isso não é verdade para modelos não aninhados.
fonte
Dois modelos não são aninhados ou separados se um modelo não puder ser obtido como limite do outro (ou um modelo não é um caso particular do outro)
fonte
Você perguntou sobre a diferença entre modelos aninhados e não aninhados. Vejo:
Onde o assunto de modelos não aninhados ou separados foi tratado pela primeira vez ou no meu próximo livro: Escolha de modelos separados ou não aninhados .
fonte
Veja uma resposta mais simples neste pdf . Essencialmente, um modelo aninhado é um modelo com menos variáveis que um modelo completo. Uma intenção é procurar respostas mais parcimoniosas.
fonte