Qual é a hipótese nula para os valores de p individuais em regressão múltipla?

7

Eu tenho um modelo de regressão linear para uma variável dependente base em duas variáveis ​​independentes, e , então eu tenho uma forma geral de uma equação de regressãoYX1X2

Y=A+B1X1+B2X2+ϵ ,

onde é a interceptação, é o termo de erro e e são os respectivos coeficientes de e . Realizo uma regressão múltipla com o software (statsmodel em Python) e obtenho coeficientes para o modelo: . O modelo também me fornece valores de para cada coeficiente: , e . Minha pergunta é: Qual é a hipótese nula para esses valores individuais de ? Por exemplo, para obter eu sei que a hipótese nula implica um coeficiente 0 paraAϵB1B2X1X2A=a,B1=b1,B2=b2ppap1p2pp1B1, mas e as outras variáveis? Em outras palavras, se a hipótese nula for , quais são os valores de e para a hipótese nula da qual o valor de é derivado?Y=A+0X1+B2X2AB2pB1

tmldwn
fonte
2
Está faltando um termo de erro no seu modelo.
Andreas Dzemski

Respostas:

6

A hipótese nula é que basicamente significa que o valor nulo hipótese não restringe B2 e A. A hipótese alternativa é De certa forma, a hipótese nula no modelo de regressão múltipla é uma hipótese composta. É "feliz" podermos construir uma estatística de teste essencial que não dependa do valor real de B2 e A, para que não soframos penalidades por testar uma hipótese nula composta.

H0:B1=0andB2RandAR,
H1:B10andB2RandAR.

Em outras palavras, existem muitas distribuições diferentes de que são compatíveis com a hipótese nula . No entanto, todas essas distribuições levam ao mesmo comportamento da estatística de teste usada para testar .(Y,X1,X2)H0H0

Na minha resposta, não lidei com a distribuição de e assumi implicitamente que se trata de uma variável aleatória normal normal centrada e independente. Se apenas assumirmos algo como , uma conclusão semelhante é válida assintoticamente (sob premissas de regularidade).ϵ

E[ϵX1,X2]=0

Andreas Dzemski
fonte
Mas, pelo que entendi, a hipótese nula não precisa ser uma distribuição de probabilidade? Se eu tiver valores específicos para os coeficientes, posso gerar uma distribuição de probabilidade adicionando ruído (epsilon) à equação de regressão. Mas se eu não tenho valores específicos para coeficientes, como eu geraria a distribuição de probabilidade nula?
tmldwn
Uma hipótese nula composta é todo um conjunto de possíveis medidas de probabilidade.
Andreas Dzemski
Eu editei minha resposta para enfatizar esse ponto.
Andreas Dzemski
2
@ tmldwn: Aqui, a distribuição marginal da estatística t realmente não depende de onde estamos no nulo. Se você acha isso difícil de entender, sugiro que você faça cuidadosamente a derivação da distribuição da estatística t. Observe que a estatística t depende do estimador LS. De certa forma, isso ajusta automaticamente a estatística de teste corretamente para a hipótese "verdadeira" no espaço nulo (não precisamos assumir uma posição sobre o que A, B2 é porque não precisamos deles para calcular a estatística de teste).
Andreas Dzemski
11
Esta resposta está completamente errada. Como explicado neste documento, há anova para toda a regressão, mas um teste t para cada coeficiente: reliawiki.org/index.php/…
Josh
0

Você pode fazer as mesmas suposições para as outras variáveis ​​que o X1. A tabela ANOVA da regressão fornece informações específicas sobre cada significância de variável e a significância geral. No que diz respeito à análise de regressão, a aceitação da hipótese nula implica que o coeficiente da variável é zero, dado um certo nível de significância.

Se você deseja adquirir um aspecto mais intuitivo do problema, pode estudar mais sobre o teste de hipóteses.

Logicseeker
fonte