Eu gostaria de ajustar um modelo linear (lm) onde a variação dos resíduos é claramente dependente da variável explicativa.
A maneira como sei fazer isso é usando glm com a família Gamma para modelar a variação e, em seguida, coloque seu inverso nos pesos na função lm (exemplo: http://nitro.biosci.arizona.edu/r/chapter31 .pdf )
Eu estava me perguntando:
- Essa é a única técnica?
- Que outras abordagens são relevantes?
- Quais pacotes / funções R são relevantes para esse tipo de modelagem? (exceto glm, lm)
glm()
entãolm()
no capítulo ao qual você vincula. Parece-me queglm()
é tudo o que é necessário e usado lá, mas posso ter perdido alguma coisa. Você pode tentar os mínimos quadrados generalizados (gls()
em nlme ), que permitem estimar pesos para controlar o tipo de heterocedasticidade mencionado; veja?varFunc
e siga os links de lá. O IIRCvarFixed()
fará o que você quiser.Respostas:
Comprimidos contra o "efeito megafone" incluem (entre outros):
rlm()
noMASS
pacote de R faz a estimativa M, que deve ser robusta à desigualdade de variâncias.Edição de julho de 2017: Parece que os mínimos quadrados generalizados, conforme sugerido na resposta de Greg Snow, são uma das melhores opções.
fonte
Com o pacote gamlss , você pode modelar a distribuição de erros da resposta como uma função linear, não linear ou suave das variáveis explicativas. Essa parece ser uma abordagem bastante poderosa (eu aprendi muito sobre todas as possibilidades que podem surgir durante o processo de seleção de modelos) e tudo está bem explicado em várias publicações (incluindo livros) mencionadas no link acima.
fonte
A
gls
função nonlme
pacote para R pode estimar a regressão e o relacionamento com a variação ao mesmo tempo. Veja oweights
argumento e o segundo exemplo na página de ajuda.fonte