Comparando resíduos entre regressões OLS e não OLS

9

Suponha que você queira estimar um modelo linear: ( n observações da resposta p+1 preditores)

E(yEu)=β0 0+j=1pβjxEuj

Uma maneira de fazer isso é através da solução OLS, ou seja, escolha os coeficientes para que a soma dos erros quadrados seja mínima:

(β0 0,β1,,βp)T=argminβ0 0,β1,,βpEu=1n(yEu-β0 0-j=1pβjxEuj)2

Como alternativa, você pode usar outra função de perda, como a soma dos desvios absolutos, para que:

(β0,β1,,βp)T=argminβ0,β1,,βpi=1n|yiβ0j=1pβjxij|

Suponha que você tenha encontrado os parâmetros para os dois modelos e queira escolher o modelo com o menor valor da função de perda. Como você pode comparar os valores mínimos atingidos pelas funções de perda em geral? (ou seja, não apenas neste caso específico - também poderíamos tentar outras funções de perda baseadas em Lp ) Parece haver uma diferença na escala das funções - uma lida com quadrados enquanto a outra não.

Comp_Warrior
fonte
1
Bem, as premissas de Markov permitem mostrar que a primeira equação é AZUL, ou o melhor estimador linear e imparcial. Nesse caso, "Melhor" é determinado por ter os menores erros padrão de todos os estimadores possíveis. Essa não é uma estatística adequada?
gregmacfarlane
2
observe que e, portanto, arg min β 0 , β 1 , , β p__x__2__x__1n__x__2
argminβ0 0,β1,,βpEu=1n(yEu-β0 0-j=1pβjxEuj)2argminβ0 0,β1,,βpEu=1n|yEu-β0 0-j=1pβjxEuj|(n)argminβ0 0,β1,,βpEu=1n(yEu-β0 0-j=1pβjxEuj)2
Manuel
1
@gmacfarlane Quero definir "melhor" aqui em termos do valor mínimo da função de perda, em vez do erro padrão nas estimativas de parâmetros. (só por curiosidade)
Comp_Warrior
2
Eu acho que você não pode comparar os ajustes que vêm de duas funções de perda diferentes, porque são respostas para perguntas diferentes. Depois que você decide que uma determinada função de perda é a apropriada para sua situação, o ajuste segue dessa decisão. Você não pode dobrá-lo novamente para validar a escolha da função de perda sem que isso se torne circular. Se você tiver algum outro critério pelo qual ambas as funções de perda possam ser compreendidas, você poderá usá-lo, mas precisará defini-lo antecipadamente.
gung - Restabelece Monica
1
Observe que, se o modelo para a expectativa estivesse correto e o tamanho da amostra fosse grande o suficiente para que ambas as estimativas estivessem efetivamente no valor da população, a pergunta seria efetivamente convertida em "Como faço para comparar um desvio médio com um desvio padrão"? Sob qualquer premissa distributiva, você poderia comparar o tamanho esperado, mas é claro que em pequenas amostras as estimativas diferem.
Glen_b -Reinstala Monica

Respostas:

4

(Convertendo meu comentário em uma resposta.)

Eu acho que você não pode comparar os ajustes resultantes de diferentes funções de perda, porque são respostas para diferentes perguntas. Depois que você decide que uma determinada função de perda é a apropriada para sua situação, o ajuste segue dessa decisão. Você não pode dobrá-lo novamente para validar a escolha da função de perda sem que isso se torne circular. Se você tiver algum outro critério pelo qual ambas as funções de perda possam ser compreendidas, você poderá usá-lo, mas precisará defini-lo antecipadamente.

- Reinstate Monica
fonte