Estou tentando expandir meu conhecimento de estatística. Eu venho de uma experiência em ciências físicas com uma abordagem "baseada em receita" para testes estatísticos, onde dizemos que é contínuo, é normalmente distribuído - regressão OLS .
Na minha leitura, encontrei os termos: modelo de efeitos aleatórios, modelo de efeitos fixos, modelo marginal. Minhas perguntas são:
- Em termos muito simples, o que são?
- Quais são as diferenças entre eles?
- Algum deles é sinônimo?
- Onde os testes tradicionais como regressão OLS, ANOVA e ANCOVA se enquadram nessa classificação?
Apenas tentando decidir para onde ir em seguida com o auto-estudo.
Respostas:
Esta questão foi discutida parcialmente neste site, como abaixo, e as opiniões parecem contraditórias.
Todos os termos geralmente estão relacionados a dados longitudinais / em painel / agrupados / hierárquicos e medidas repetidas (no formato de regressão avançada e ANOVA), mas têm múltiplos significados em diferentes contextos. Gostaria de responder à pergunta em fórmulas baseadas no meu conhecimento.
Modelo de efeitos fixos
Modelo de efeitos aleatórios
Modelo marginal
O modelo marginal é geralmente comparado ao modelo condicional (modelo de efeitos aleatórios), e o primeiro se concentra na média da população (por exemplo, modelo linear) enquanto este lida com a média condicionalA interpretação e a escala dos coeficientes de regressão entre o modelo marginal e o modelo de efeitos aleatórios seriam diferentes para modelos não lineares (por exemplo, regressão logística). Seja , então
fonte
Corrija-me se eu estiver errado aqui:
Conceitualmente, existem quatro efeitos possíveis: interceptação fixa, coeficiente fixo, interceptação aleatória, coeficiente aleatório. A maioria dos modelos de regressão são 'efeitos aleatórios'; portanto, eles têm interceptações e coeficientes aleatórios. O termo "efeito aleatório" entrou em uso em contraste com "efeito fixo".
'Efeito fixo' é quando uma variável afeta parte da amostra, mas não todas. A versão mais simples de um modelo de efeito fixo (conceitualmente) seria uma variável dummy, para um efeito fixo com um valor binário. Esses modelos têm uma única interceptação aleatória, coeficientes de efeito fixo e coeficientes variáveis aleatórios.
O próximo nível de complicação (conceitualmente) é quando o efeito fixo não é binário, mas nominal, com muitos valores. Nesse caso, o que é gerado é um modelo com muitas interceptações (uma para cada um dos valores nominais). É aqui que você obtém as 'múltiplas linhas' clássicas de um modelo de dados em painel , onde cada uma das 'opções' de uma variável de efeito fixo obtém seu próprio efeito. A virtude de jogar todas as diferentes séries de dados específicas de fatores em uma única regressão (em vez de fazer cada fator do efeito fixo como sua própria regressão) é que você consegue agrupar a variação de todos os diferentes efeitos em uma equação e, portanto, obtenha melhores (mais certos) valores para todos os seus coeficientes.
O 'nível três' de complicação seria quando o 'efeito fixo' for em si uma variável aleatória, exceto que seus efeitos são 'fixos' para afetar apenas um subconjunto da amostra. Nesse ponto, o modelo teria uma interceptação aleatória, várias interceptações fixas e várias variáveis aleatórias. Eu acho que isso é o que é conhecido como modelo de 'efeitos mistos'?
Os modelos de 'efeito misto' são usados para modelagem de vários níveis (MLM), pois os 'efeitos fixos' podem ser usados para aninhar um subconjunto de dados dentro de outro. Esse agrupamento pode ter várias camadas, com os alunos aninhados nas salas de aula, aninhados nas escolas. A escola é um efeito fixo nas salas de aula e nos alunos. (A escola pode ou não ter um efeito fixo no aluno, dependendo do desenho experimental - não tenho certeza)
Os modelos de dados em painel são modelos de 'efeito misto', mas usam duas dimensões para agrupar, geralmente tempo e algum tipo de categoria.
fonte