Distribuição amostral dos coeficientes de regressão

11

Eu aprendi anteriormente sobre distribuições de amostras que deram resultados que eram para o estimador, em termos do parâmetro desconhecido. Por exemplo, para as distribuições de amostragem de β 0 e β 1 no modelo de regressão linear Y i = β o + β 1 X i + ε iβ^0β^1Yi=βo+β1Xi+εi

β^0N(β0, σ2(1n+x¯2Sxx))
e β1~N(β1,σ2
β^1N(β1, σ2Sxx)

onde Sxx=i=1n(xi2)nx¯2

Mas agora eu vi o seguinte em um livro :

Suponha que ajustemos o modelo por mínimos quadrados da maneira usual. Considere a distribuição posterior bayesiana e escolha anteriores para que isso seja equivalente à distribuição frequente de amostras freqüentes, ou seja ......

(β0β1)N2[(β^1β^2), σ^2(ni=1nxii=1nxii=1nxi2)1]

Isso está me confundindo porque:

  1. Por que as estimativas aparecem no lado esquerdo (lhs) das 2 primeiras expressões e no lado direito (rhs) da última expressão?
  2. Por que os chapéus beta na última expressão têm 1 e 2 subscritos em vez de 0 e 1?
  3. São apenas representações diferentes da mesma coisa? Se eles são, alguém poderia me mostrar como eles são equivalentes? Caso contrário, alguém poderia explicar a diferença?
Joe King
fonte

Respostas:

7

Esta parte está relacionada principalmente à sua primeira, terceira e quarta pergunta:

Há uma diferença fundamental entre as estatísticas bayesianas e as estatísticas freqüentes.

θ

P(θ|x_)

Isso resulta em coisas que geralmente parecem semelhantes, mas onde as variáveis ​​em uma parecem "de maneira errada", vistas através das lentes da outra maneira de pensar sobre isso.

Então, fundamentalmente, são coisas um pouco diferentes , e o fato de que as coisas que estão no LHS de um estão no RHS do outro não é um acidente.

Se você trabalha com os dois, logo fica razoavelmente claro.

A segunda pergunta parece-me relacionar simplesmente com um erro de digitação.

---

a afirmação "equivalente à distribuição freqüente de amostragem freqüente, isto é": entendi que isso significava que os autores estavam declarando a distribuição de amostragem freqüentista. Eu li isso errado?

Há duas coisas acontecendo lá - elas expressaram algo um pouco vagamente (as pessoas fazem esse tipo de expressão excessivamente frouxa o tempo todo), e acho que você também está interpretando de maneira diferente da intenção.

O que exatamente significa a expressão que eles dão?

Esperamos que a discussão abaixo ajude a esclarecer o sentido pretendido.

Se você puder fornecer uma referência (pref. Online, pois não tenho um bom acesso à biblioteca) onde essa expressão é derivada, ficaria muito grato.

Segue-se a partir daqui:

http://en.wikipedia.org/wiki/Bayesian_linear_regression

βσ2

A razão é que o posterior é proporcional à probabilidade e os intervalos gerados a partir dos posteriores nos parâmetros correspondem aos intervalos de confiança freqüentes para os parâmetros.

Você pode encontrar as primeiras páginas aqui úteis também.

Glen_b -Reinstate Monica
fonte
Obrigado, isso é útil. Eu já fiz algumas estatísticas Bayesianas. No entanto, ainda estou um pouco confuso, por causa da afirmação "equivalente à distribuição frequente de amostras freqüentes" : entendi que isso significava que os autores estavam declarando a distribuição de amostras freqüentes. Eu li isso errado? O que exatamente significa a expressão que eles dão? Se você puder fornecer uma referência (pref. Online, pois não tenho um bom acesso à biblioteca) onde essa expressão é derivada, ficaria muito grato.
Joe King
Joe - veja minha edição acima
Glen_b -Reinstala Monica