Quando os modelos lineares impróprios ficam robustos?

9

Questões:

  • Modelos lineares impróprios são utilizados na prática ou algum tipo de curiosidade é descrita de tempos em tempos em revistas científicas? Em caso afirmativo, em que áreas eles são usados?
  • Existem outros exemplos de tais modelos?
  • Finalmente, os erros padrão, valores- , etc. retirados do OLS para esses modelos estão corretos ou devem ser corrigidos de alguma forma?pR2

Antecedentes: Modelos lineares inadequados são descritos periodicamente na literatura. Em geral, esses modelos podem ser descritos como

y=uma+bEuWEuxEu+ε

o que os torna diferentes da regressão é que não são coeficientes estimados no modelo, mas são pesos que sãoWj

  • igual para cada variável ( regressão ponderada por unidade ),WEu=1 1
  • com base nas correlações (Dana e Dawes, 2004),WEu=ρ(y,xEu)
  • escolhidos aleatoriamente (Dawes, 1979),
  • -1 1 para variáveis ​​relacionadas negativamente a , para variáveis ​​relacionadas positivamente a (Wainer, 1976).y1 1y

Também é comum usar algum tipo de redimensionamento de recurso, como converter variáveis ​​em escoresPortanto, esse tipo de modelo pode ser simplificado para regressão linear univariadaZ

y=uma+bv+ε

onde , e pode ser simplesmente estimado usando a regressão OLS.v=WEux

Referências:
Dawes, Robyn M. (1979). A beleza robusta de modelos lineares impróprios na tomada de decisão . American Psychologist, 34, 571-582.

Graefe, A. (2015). Melhorando previsões usando preditores igualmente ponderados . Journal of Business Research, 68 (8), 1792-1799.

Wainer, Howard (1976). Estimando coeficientes em modelos lineares: isso não deixa nada a desejar . Boletim Psicológico 83 (2), 213.

Dana, J. e Dawes, RM (2004). A superioridade de alternativas simples à regressão para previsões de ciências sociais . Jornal de Estatísticas Educacionais e Comportamentais, 29 (3), 317-331.

Tim
fonte
3
Em que sentido as estatísticas derivadas desses modelos seriam "incorretas"?
whuber
11
WEubyWEu
11
Não foi um comentário informado - os papéis ainda estão na minha pilha de "ler". Eu apenas me perguntei: - "por que 'impróprio'?". Não é incomum que um preditor seja uma combinação linear de outras variáveis ​​- uma média de várias medidas, uma pontuação do componente principal, uma previsão de outra regressão, o nível de uma série temporal suavizada exponencialmente ou um valor calculado de um bem estabelecido ou um índice ad hoc. Não estimar os pesos a partir da resposta poupa graus de liberdade, ajudando a evitar o excesso de ajuste com tamanhos de amostra menores.
Scortchi - Reinstate Monica
11
xEuWEuxEu
4
WEu=ρ(y,xEu)ρ

Respostas:

1

De fato, parece-me que essa é uma variedade de estruturas de covariância assumidas. Em outras palavras, esse é um tipo de modelagem Bayesiana anterior.

|β^|<|β|R^2<R2

Minha experiência pessoal é que o superior à abordagem bayesiana é usar uma melhor modelagem; transformar parâmetros, usar outras normas e / ou usar métodos não lineares. Ou seja, uma vez que a física do problema e os métodos sejam adequadamente explorados e coordenados, as estatísticas F, o coeficiente de determinação, etc. melhoram em vez de degradar.

Carl
fonte