Regressão através da origem

9

Temos os seguintes pontos: Como podemos encontrar a melhor linha de ajuste através dos pontos? Minha calculadora tem a opção de encontrar a melhor linha de ajuste através desses pontos, que é:y = a x y = a x + b

(0,0)(1,51.8)(1.9,101.3)(2.8,148.4)(3.7,201.5)(4.7,251.1)(5.6,302.3)(6.6,350.9)(7.5,397.1)(8.5,452.5)(9.3,496.3)
y=axy=ax+b

y=53.28x+0.37

Como posso encontrar o melhor ajuste para ? Parece-me que não podemos simplesmente remover a sem compensar na ?0,37 ay=ax0.37a

EdwardHarrison
fonte
2
Existe alguma razão para você querer? Suprimir a interceptação leva a um modelo tendencioso, exceto se a interceptação for exatamente zero a infinitas casas decimais. Mesmo assim, você não ganha muita eficiência.
gung - Restabelece Monica
1
Estes são os resultados de um experimento de física. Se tiver um intercepto em y, isso levaria a coisas completamente incorretas.
23913 EdwardHarrison
@gung Isso significa que basta remover o ? 0.37
EdwardHarrison 31/03
5
"Suprimir a interceptação" não significa simplesmente excluir a estimativa do seu modelo, significa ajustar um modelo por meio de uma fórmula diferente que força a linha a passar pela origem.
gung - Restabelece Monica
6
"experimento de física. [...] interceptação em [...] y levaria a coisas completamente incorretas." Mas se os dados experimentais indicarem uma interceptação (btw, você pode verificar se o intervalo de confiança da linha cobre a origem), isso me faria pensar muito de onde vem a interceptação. Sou químico analítico. Na química analítica, também temos um monte de relacionamentos que devem ser lineares sem interceptação. Mas eles quase nunca estão na prática, por causa dos detalhes minuciosos de instrumentos e medições. Assim, geralmente vemos suprimir a interceptação como uma péssima idéia.
cbeleites descontente com SX 31/03

Respostas:

13

Os comuns Mínimos Quadrados estimativa da inclinação quando a intercepção é suprimida

β^=i=1Nxiyii=1Nxi2
- Reinstate Monica
fonte
10

@gung forneceu a estimativa do OLS. Era isso que você estava procurando.

No entanto, ao lidar com quantidades físicas nas quais a linha deve passar pela origem, é comum que a escala do erro varie com os valores de x (para ter, aproximadamente, erro relativo constante ). Nessa situação, os mínimos quadrados comuns não ponderados seriam inadequados.

Nessa situação, uma abordagem (de várias possibilidades) seria pegar logs, subtrair os x's dos y's e estimar a inclinação do log (das variáveis ​​originais) pela média das diferenças.

β^=1NEu=1NyEuxEu

Existem outras abordagens (GLMs, por exemplo), mas se você estiver fazendo isso em uma calculadora, eu me inclinaria para a minha primeira sugestão.

Você também deve considerar a adequação de quaisquer suposições feitas.


Eu pensei que poderia ser instrutivo adicionar a derivação da linha WLS através da origem e, em seguida, minha "média de inclinações" e os OLS dos casos são casos especiais:

yEu=βxEu+εEu,Var(εEu)=WEuσ2

S=EuWEu(yEu-βxEu)2

Sβ=-Eu2xEu.WEu(yEu-βxEu)

β^WEuxEuyEu=β^WEuxEu2β^=WEuxEuyEuWEuxEu2

WEu1Eu

WEu1/xEu2

Glen_b -Reinstate Monica
fonte