O que fazer com a heterogeneidade da variação quando o spread diminui com valores ajustados maiores

9

Estou tentando produzir um modelo misto linear, o código R é o seguinte.

lme (Average.payoff ~ Jogo + Tipo + Outros.Tipo + Jogo: Tipo + Jogo: Outros.Tipo + Tipo: Outros.Tipo aleatório = ~ 1 | Assuntos, método = "REML", dados = Assuntosm1) -> lme1

O termo de resposta Average.payoff é contínuo, enquanto todas as variáveis ​​explicativas são todas binárias.

Quando chego à validação, posso ver claramente que a dispersão dos resíduos diminui com valores ajustados maiores. Embora pareça haver muita informação sobre heterogeneidade na forma em que os resíduos aumentam com valores ajustados maiores, não li nada sobre casos semelhantes aos meus.

Eu plotei os resíduos contra cada efeito explicativo e posso ver que o spread diminui com valores ajustados maiores para as variáveis ​​Game e Type, mas aumenta para a variável Others.Type.

Qual é a causa disso e o que devo fazer sobre isso?

Devo considerar adicionar termos quadráticos ou usar modelagem aditiva? Existe uma transformação que deve ser aplicada?

Obrigado,

Jonathan

Jonathan Bone
fonte

Respostas:

1

Adicionar termos quadráticos ajudaria se a média variasse dessa maneira, mas a variabilidade estivesse na variação no seu caso. Como são as covariáveis ​​que causam a mudança, uma forma de estimativa da função de variância envolvendo essas covariáveis ​​seria a abordagem que recomendo.

Michael R. Chernick
fonte
1
Oi @Michael - Você pode dar mais detalhes aqui? Para alguns, pode não estar claro como você pode incorporar uma forma funcional para a variação de erro em um modelo de regressão. Você tinha algo específico em mente?
Macro
2
1
Veja Carroll et al. 79 a 85 e Fuller .
Michael R. Chernick