Estou procurando métodos que possam ser usados para estimar o modelo de erro de medição "OLS".
Onde os erros são independentes normais com variações desconhecidas e . O OLS "Padrão" não funcionará neste caso.
A Wikipedia tem algumas soluções desagradáveis - as duas são forçadas a assumir que a "taxa de variação" ou " taxa de confiabilidade " é conhecido, onde é a variação do regressor verdadeiro . Não estou satisfeito com isso, porque como alguém que não conhece as variações conhece sua proporção?
De qualquer forma, existem outras soluções além dessas duas que não exigem que eu "saiba" nada sobre os parâmetros?
Soluções para apenas a interceptação e a inclinação são boas.
regression
estimation
errors-in-variables
probabilityislogic
fonte
fonte
Respostas:
Existem várias possibilidades descritas por JW Gillard em Uma visão geral histórica da regressão linear com erros nas duas variáveis
Se você não estiver interessado em detalhes ou razões para a escolha de um método sobre outro, basta ir com o mais simples, que é o de traçar a linha através do centróide com inclinação β = s y / s x , ou seja, a razão entre os desvios padrão observados (fazendo o sinal do declive o mesmo que o sinal da covariância de x e y ); como você provavelmente pode trabalhar fora, isso dá uma interceptação na y -axis de α = ˉ y - beta ˉ x .(x¯,y¯) β^=sy/sx x y y α^=y¯−β^x¯.
Os méritos dessa abordagem específica são
A inclinação é a média geométrica das inclinações das duas inclinações de regressão linear ordinárias. Também é o que você obteria se padronizasse as observações e y , desenhasse uma linha a 45 ° (ou 135 ° se houver correlação negativa) e depois padronizasse a linha. Também poderia ser visto como equivalente a fazer uma suposição implícita de que as variações dos dois conjuntos de erros são proporcionais às variações dos dois conjuntos de observações; Até onde eu sei, você alega não saber de que maneira isso está errado.x y
Aqui está um código R para ilustrar: a linha vermelha no gráfico é regressão OLS de em X , a linha azul é regressão OLS de X em Y e a linha verde é esse método simples. Observe que a inclinação deve ser de cerca de 5.Y X X Y
fonte