O que é modelo nulo em regressão e qual a relação entre modelo nulo e hipótese nula?
Para meu entendimento, isso significa
- Usando "média da variável de resposta" para prever a variável de resposta contínua?
- Usando a "distribuição de etiquetas" na previsão de variáveis de resposta discretas?
Se for esse o caso, parece que faltam as conexões entre a hipótese nula.
fit = lm(formula = y ~ 1, data)
e deve ver a média dey
. Veja também a resposta do MorganBall. Eu concordaria mais com a resposta dele. Além disso, um modelo nulo pode ser um modelo com preditores de , com um modelo alternativo sendo um com p + k , onde k pode ser 1,2, ... covariáveis adicionais.Respostas:
Não, eu diria que "modelo nulo" tem essencialmente o mesmo significado que "hipótese nula": o modelo se a hipótese nula for verdadeira. O que isso significa, em um caso específico, é claro depende da hipótese nula concreta.
Suas interpretações como "o valor médio" (você provavelmente quer dizer "a distribuição marginal na variável de resposta"), sem levar em consideração quaisquer preditores, são uma possibilidade, correspondendo à hipótese nula de um "teste de ônibus", testando todos os parâmetros (exceto a interceptação) simultaneamente.
Mas o interesse poderia muito bem se concentrar em um modelo da forma que x 1 contém os preditores que você sabe que estão afetando o resultado, portanto não deseja testar, enquanto x 2 contém os preditores que você está testando.
Portanto, a hipótese nula será e o modelo nulo seria y i = β 0 + β T 1 x 1 i + ϵ i . Então depende.β2=0 yi=β0+βT1x1i+ϵi
fonte
Um modelo nulo está relacionado a uma hipótese nula. Tome o seguinte modelo univariado:
fonte
lm(y ~ 1, data)
emean(y)
.Na regressão, como descrito parcialmente nas outras duas respostas, o modelo nulo é a hipótese nula de que todos os parâmetros de regressão são 0. Portanto, você pode interpretar isso dizendo que, sob a hipótese nula, não há tendência e a melhor estimativa / preditor de uma nova observação é a média que é 0 no caso de não interceptar.
fonte