O que é modelo nulo em regressão e como ele se relaciona com a hipótese nula?

16

O que é modelo nulo em regressão e qual a relação entre modelo nulo e hipótese nula?

Para meu entendimento, isso significa

  • Usando "média da variável de resposta" para prever a variável de resposta contínua?
  • Usando a "distribuição de etiquetas" na previsão de variáveis ​​de resposta discretas?

Se for esse o caso, parece que faltam as conexões entre a hipótese nula.

Haitao Du
fonte
4
Observe que, em R, você pode tentar fit = lm(formula = y ~ 1, data) e deve ver a média de y. Veja também a resposta do MorganBall. Eu concordaria mais com a resposta dele. Além disso, um modelo nulo pode ser um modelo com preditores de , com um modelo alternativo sendo um com p + k , onde k pode ser 1,2, ... covariáveis ​​adicionais. pp+k
Jon
3
Aqui está uma referência para você: onlinecourses.science.psu.edu/stat501/node/295
Jon

Respostas:

11

Não, eu diria que "modelo nulo" tem essencialmente o mesmo significado que "hipótese nula": o modelo se a hipótese nula for verdadeira. O que isso significa, em um caso específico, é claro depende da hipótese nula concreta.

Suas interpretações como "o valor médio" (você provavelmente quer dizer "a distribuição marginal na variável de resposta"), sem levar em consideração quaisquer preditores, são uma possibilidade, correspondendo à hipótese nula de um "teste de ônibus", testando todos os parâmetros (exceto a interceptação) simultaneamente.

Mas o interesse poderia muito bem se concentrar em um modelo da forma que x 1 contém os preditores que você sabe que estão afetando o resultado, portanto não deseja testar, enquanto x 2 contém os preditores que você está testando.

yi=β0+β1Tx1i+β2Tx2i+ϵi
x1x2

Portanto, a hipótese nula será e o modelo nulo seria y i = β 0 + β T 1 x 1 i + ϵ i . Então depende.β2=0yi=β0+β1Tx1i+ϵi

kjetil b halvorsen
fonte
2
A hipótese nula é geralmente algo específico sobre os valores dos parâmetros; Eu diria que o modelo nulo seria a hipótese nula, além de todas as suposições associadas sob as quais a distribuição nula da estatística de teste seria derivada - são as suposições que contêm a maior parte do modelo. Por exemplo, a hipótese nula não menciona independência, mas eu definitivamente diria que faz parte do modelo nulo.
Glen_b -Reinstala Monica
18

Um modelo nulo está relacionado a uma hipótese nula. Tome o seguinte modelo univariado:

Y=α+β1X+ϵ

β1

H0:β1=0

HA:β10

β1X

Y=α+ϵ

Y

Morgan Ball
fonte
1
Até o último ponto, sim, isso está correto. Em R, você pode ver isso comparando a interceptação de lm(y ~ 1, data)e mean(y).
Jon
2
+1 Boa resposta Morgan! Tomei a liberdade de editar sua notação um pouco, porque ela parecia estranha.
Alexis #
9

Na regressão, como descrito parcialmente nas outras duas respostas, o modelo nulo é a hipótese nula de que todos os parâmetros de regressão são 0. Portanto, você pode interpretar isso dizendo que, sob a hipótese nula, não há tendência e a melhor estimativa / preditor de uma nova observação é a média que é 0 no caso de não interceptar.

Michael R. Chernick
fonte
1
Esta resposta me ajudou a entender nulo = 0 em coeficientes (exceto interceptação), obrigado!
Haitao Du
1
Além disso, o modelo pode ser o único modelo de interceptação, em comparação com outro modelo.
D2Williams
1
+1, esta é uma adição útil ao segmento. No entanto, eu diria que esse é um uso específico e muito restritivo do termo "modelo nulo". O termo é frequentemente (na maioria das vezes, no meu palpite) usado de forma mais vaga.
gung - Restabelece Monica