Estou curioso sobre a declaração feita na parte inferior da primeira página neste texto sobre o ajuste
O texto declara:
A lógica do ajuste é a seguinte: na regressão múltipla comum, um preditor aleatório explica em média uma proporção da variação da resposta, de modo que preditores aleatórios explicam juntos, em média, da variação da resposta; em outras palavras, o valor esperado de é . A aplicação da fórmula [ ] a esse valor, onde todos os preditores são aleatórios, fornece ".
Essa parece ser uma motivação muito simples e interpretável para . No entanto, não consegui descobrir que para um único preditor aleatório (isto é, não correlacionado). E ( R 2 ) = 1 / ( n - 1 )
Alguém poderia me apontar na direção certa aqui?
regression
expected-value
goodness-of-fit
r-squared
gregory_britten
fonte
fonte
Respostas:
Esta é uma estatística matemática precisa. Veja este post para obter a derivação da distribuição deR2 , sob a hipótese de que todos os regressores (barra o termo constante) não estão correlacionadas com a variável dependente ( "preditores aleatórias").
Essa distribuição é Beta, com sendo o número de preditores sem contar o termo constante, e nm n o tamanho da amostra,
e entao
Esta parece ser uma maneira inteligente de "justificar" a lógica por trás da ajustado : Se de fato todos os regressores não são correlacionadas, então o ajustado R 2 é "em média" zero.R2 R2
fonte