Por que não uma regressão robusta sempre?

12

Os exemplos desta página mostram que a regressão simples é marcadamente afetada por valores discrepantes e isso pode ser superado por técnicas de regressão robusta: http://www.alastairsanderson.com/R/tutorials/robust-regression-in-R/ . Acredito que lmrob e ltsReg são outras técnicas robustas de regressão.

Por que não se deve fazer uma regressão robusta (como rlm ou rq) toda vez, em vez de executar uma regressão simples (lm)? Existem desvantagens dessas técnicas robustas de regressão? Obrigado pela sua compreensão.

rnso
fonte
2
Isso pode ser útil.
conjugadoprior

Respostas:

6

O teorema de Gauss-Markov :

Em um modelo linear com erros esféricos (que ao longo do caminho inclui uma suposição de ausência de valores extremos, por meio de uma variação finita de erros), o OLS é eficiente em uma classe de estimadores não lineares lineares - existem (restritivas, com certeza) condições sob as quais " você não pode fazer melhor que o OLS ".

Christoph Hanck
fonte
Portanto, se não houver discrepâncias, a regressão linear seria a melhor. Mas se houver, ou se outras suposições estiverem sendo violadas, apenas uma deve realizar regressões robustas. Isso está correto?
rnso
2
Se houver discrepâncias, outras técnicas serão melhores, sim. Eu não chegaria à conclusão de que "se outras suposições estão sendo violadas, então [...] deve-se realizar regressões robustas" - não é uma solução definitiva para todas as violações. Por exemplo, quando erros são correlacionados com regressores e você está atrás de efeitos causais, são necessárias técnicas de variáveis ​​instrumentais.
Christoph Hanck