O OLS é assintoticamente eficiente sob heterocedasticidade

9

Eu sei que o OLS é imparcial, mas não eficiente sob heterocedasticidade em um cenário de regressão linear.

Na Wikipedia

http://en.wikipedia.org/wiki/Minimum_mean_square_error

O estimador MMSE é assintoticamente imparcial e converge na distribuição para a distribuição normal: , onde I (x) é a informação de Fisher de x. Assim, o estimador MMSE é assintoticamente eficiente.n(x^x)dN(0,I1(x))

MMSE é reivindicado ser assintoticamente eficiente. Estou um pouco confuso agora.

Isso significa que o OLS não é eficiente em amostras finitas, mas é eficiente assintoticamente sob heterocedasticidade?

Crítica das respostas atuais: Até o momento, as respostas propostas não tratam da distribuição limitadora.

desde já, obrigado

Cagdas Ozgenc
fonte
Esse é um artigo bastante longo da Wikipedia. Como, além disso, eles estão sujeitos a alterações, você se importaria de citar a passagem que causa confusão?
hejseb
11
As informações de Fisher são derivadas da função de probabilidade. Portanto, implica implicitamente que a probabilidade foi especificada corretamente. ou seja, a declaração a que você se refere assume que, se houver heterocedasticidade, a regressão foi ponderada de forma que a heterocedasticidade foi especificada corretamente. Consulte en.wikipedia.org/wiki/Least_squares#Weighted_least_squares . Na prática, muitas vezes não sabemos a forma da heterocedasticidade; portanto, às vezes aceitamos a ineficiência em vez de ter a chance de influenciar a regressão ao não especificar os esquemas de ponderação.
Zachary Blumenfeld
@ZacharyBlumenfeld Não havia nenhuma suposição sobre a distribuição de x no artigo. Como terminamos com as informações de Fisher?
Cagdas Ozgenc # 1/15
11
Veja en.wikipedia.org/wiki/Fisher_information O artigo implica uma distribuição em e quando toma expectativas na seção definição. Observe que a homoscedasticidade nunca foi assumida lá. No contexto da OLS, homoscedacticity assumido , a matriz identidade. A heteroscedacticidade permite , qualquer Positivo diagonal semi-definido. Usando resultaria em uma informação diferente Fisher do que seria usando . xeeN(0,σI)IeN(0,D)DDσI
Zachary Blumenfeld
onde posso ver uma prova desse fato de que "o MMSE converge em distribuição para a distribuição normal?"
Hajir

Respostas:

3

O artigo nunca assumiu homoskadasticidade na definição. Para colocá-lo no contexto do artigo, a homoskedasticidade estaria dizendo Onde a matriz de identidade e é um número positivo escalar. A heteroscadasticidade permite

E{(x^x)(x^x)T}=σI
In×nσ

E{(x^x)(x^x)T}=D

Qualquer diaganol positivo definitivo. O artigo define a matriz de covariância da maneira mais geral possível, como o segundo momento centralizado de alguma distribuição multivariável implícita. devemos conhecer a distribuição multivariada de para obter uma estimativa assintoticamente eficiente e consistente de . Isso virá de uma função de probabilidade (que é um componente obrigatório do posterior). Por exemplo, suponha (isto é, . Então a função de probabilidade implícita é Onde é o pdf normal multivariado.Dex^eN(0,Σ)E{(x^x)(x^x)T}=Σ

log[L]=log[ϕ(x^x,Σ)]
ϕ

A matriz de informações de Fisher pode ser escrita como veja en.wikipedia.org/wiki/Fisher_information para mais informações. É daqui que podemos derivar O exemplo acima está usando uma função de perda quadrática, mas não assumindo homoscedasticidade.

I(x)=E[(xlog[L])2|x]
n(x^x)dN(0,I1(x))

No contexto do OLS, onde regredimos em , assumimos A probabilidade implícita é Que pode ser convenientemente reescrito como o pdf normal univariado. A informação do pescador é então yx

E{y|x}=xβ
log[L]=log[ϕ(yxβ,σI)]
log[L]=i=1nlog[φ(yxβ,σ)]
φ
I(β)=[σ(xx)1]1

Se a homocedasticidade não for atendida, as informações de Fisher, conforme declaradas, são especificadas em falta (mas a função de expectativa condicional ainda está correta), portanto as estimativas de serão consistentes, mas ineficientes. Poderíamos reescrever a probabilidade de explicar a heteroskacticity e a regressão é eficiente, ou seja, podemos escrever Isso é equivalente a certas formas de Mínimos Quadrados Generalizados , como mínimos quadrados ponderados. No entanto, essa vontadelog [ L ] = log [ ϕ ( y - x β , D ) ] β 1β

log[L]=log[ϕ(yxβ,D)]
alterar a matriz de informações de Fisher. Na prática, muitas vezes não sabemos a forma da heterocedasticidade, portanto, às vezes, preferimos aceitar a ineficiência em vez de influenciar a regressão ao acaso por falta de especificação dos esquemas de ponderação. Nesses casos, a covariância assintótica de não é conforme especificado acima.β 1nI1(β)
Zachary Blumenfeld
fonte
Obrigado por todo o tempo que você passou. No entanto, acho que a entrada no wiki é uma porcaria total. O MMSE não fornecerá eficiência e em nenhum lugar é especificado que as amostras sejam pesadas adequadamente. Além disso, mesmo se assumirmos que as amostras são ponderadas, ele ainda não é um estimador eficiente, a menos que a distribuição seja gaussiana, que também não é especificada.
Cagdas Ozgenc 01/04
@CagdasOzgenc Eu discordo respeitosamente. O artigo é redigido de uma maneira bayesiana geral, que pode incluir regressão, mas também muitos outros modelos (parece ser voltado mais para o filtro de Kalman). A probabilidade é o estimador mais eficiente quando é conhecido; essa é uma propriedade básica da probabilidade. O que você diz se aplica estritamente a um subconjunto de modelos de regressão (embora entre os modelos mais amplamente aplicados) em que a normalidade é assumida ao derivar condições de primeira ordem.
Zachary Blumenfeld
11
Você mesmo disse. Infelizmente, o artigo não trata do estimador de probabilidade. É o Estimador Mínimo do Quadrado Médio, que é eficiente quando determinadas condições são satisfeitas.
Cagdas Ozgenc # 1/15
Tudo bem, eu concordo em discordar :) Talvez haja um conflito com a definição de MMSE entre como ele é usado na regressão mais frequente e como é aplicado aqui em um cenário mais bayesiano. Talvez eles devessem inventar um novo nome para ele. No entanto, as probabilidades (ou talvez outras estimativas não paramétricas) estão implícitas quando se assume expectativas independentes sobre cada resíduo quadrado. especialmente em um cenário bayesiano (caso contrário, como estimaríamos isso?). Após pesquisar no Google, encontrei muitos resultados semelhantes aos da Wikipedia. De qualquer forma, concordo que a terminologia está sendo abusada.
Zachary Blumenfeld
2

Não, o OLS não é eficiente sob heterocedasticidade. A eficiência de um estimador é obtida se o estimador tiver a menor variação entre outros estimadores possíveis. Declarações sobre eficiência no OLS são feitas independentemente da distribuição limitadora de um estimador.

cara aleatório
fonte