Como converter coeficientes padronizados em coeficientes não padronizados?

11

Meu objetivo é usar os coeficientes derivados de pesquisas anteriores sobre o assunto para prever resultados reais, considerando um conjunto de variáveis ​​independentes. No entanto, o trabalho de pesquisa lista apenas os coeficientes Beta e o valor t. Eu gostaria de saber se é possível converter os coeficientes padronizados em não padronizados.

Seria útil converter minhas variáveis ​​independentes não padronizadas em variáveis ​​padronizadas para calcular o valor previsto? Como eu retornaria a um valor previsto não padronizado (se isso é possível?)

Linha de amostra adicionada do papel:

Número de rotas de ônibus (linhas de ônibus) | 0,275 (beta) | 5,70 *** (valor t)

Também me foi dado sobre as variáveis ​​independentes:

Número de rotas de ônibus (linhas de ônibus) | 12,56 (méd.) | 9,02 (DST) | 1 (min) | 53 (máximo)


fonte
Como os coeficientes foram padronizados? Em geral os 's têm uma unidade que é a unidade de dividida pela unidade de , qual é a sua unidade no papel? Y XβYX
precisa saber é o seguinte
1
Não sei se entendi sua pergunta. Aqui está uma linha de amostra de uma variável independente após a análise de regressão do trabalho. Características de fornecimento de trânsito: Número de rotas de ônibus (linhas de ônibus) | 0,275 (beta) | 5,70 *** (t-value)
O coeficiente em si não é padronizado, como mencionado anteriormente. Mas a estatística t é o coeficiente estimado dividido pelo seu desvio padrão estimado. Dado t e os graus de liberdade, você pode calcular o valor p e o desvio padrão estimado, porque Beta = valor t x desvio padrão estimado. Mas não tenho certeza se é isso que você está procurando ou não. A estimativa beta não é padronizada. A estatística t é a forma padronizada da estimativa de batida. Então você já tem o coeficiente padronizado.
Michael R. Chernick

Respostas:

14

Parece que o artigo usa um modelo de regressão múltipla no formulário

Y=β0+iβiξi+ε

onde os são versões padronizadas das variáveis ​​independentes; viz. ,ξi

ξi=ximisi

com a média (como 12,56 no exemplo) e o desvio padrão (como 9,02 no exemplo) dos valores da variável variável ('linhas de linha' no exemplo). é a interceptação (se presente). Conectar esta expressão ao modelo ajustado , com seus "betas" escritos como (0,275 no exemplo) e fazer álgebra fornece as estimativass i i th x i β 0 ^ β imisiithxiβ0βi^

Y^=β0^+iβi^ximisi=(β0^(iβimi^si))+i(βi^si)xi.

Isso mostra que os coeficientes do no modelo (além do termo constante) são obtidos dividindo os betas pelos desvios padrão das variáveis ​​independentes e que a interceptação é ajustada subtraindo uma combinação linear adequada dos betas.xi

Isso fornece duas maneiras de prever um novo valor a partir de um vetor de valores independentes:(x1,,xp)

  1. Usando as médias e os desvios padrão conforme relatado no artigo (não recalculado a partir de novos dados!), Calcule e conecte-os à fórmula de regressão conforme fornecida pelos betas ou, equivalente,misi (ξ1,,ξp)=((x1m1)/s1,,(xpmp)/sp)

  2. Conecte à fórmula algebricamente equivalente derivada acima.(x1,,xp)

Se o documento estiver usando um Modelo Linear Generalizado , talvez você precise seguir esse cálculo aplicando a função "link" inversa a . Por exemplo, com a regressão logística, seria necessário aplicar a função logística para obter a probabilidade prevista ( é a probabilidade de log prevista).Y^1/(1+exp(Y^))Y^

whuber
fonte
Perfeito, obrigado! Recebi ajuda de um colega. Mais uma pergunta: meu novo valor (chapéu Y) é muito baixo. O autor usa uma variável dependente logaritmicamente transformada em sua regressão. Isso significa que eu devo exp (Y-hat) para expandir de volta para a unidade de medida não transformada.
Além disso, não há interceptação em Y incluído no artigo, e testar o método exp (Y-hat) parece indicar que deve haver um valor para a interceptação em Y que represente parte da variação não explicada pelo modelo, a fim de elevar o resultado previsto a um nível razoável.
Então não são os coeficientes que são padronizados. São as variáveis.
Michael R. Chernick
1
Michael M, sim, é provavelmente o que você deseja e sim, você precisa descobrir qual é a interceptação. Talvez seja necessário adivinhar a interceptação e alterá-la até que o modelo pareça reproduzir gráficos e tabelas no papel com precisão suficiente. exp(y^)
whuber
Se você deseja fazer o que o título pede, consulte aqui: www3.nd.edu/~rwilliam/stats1/x92.pdf, se o y também estiver padronizado. Consulte também stats.stackexchange.com/questions/235057/…
Chris
1

B=p×sysx
  • x é a variável independente
  • y é a variável dependente
  • s é o desvio padrão
  • p é o coeficiente do caminho
  • B é o coeficiente de regressão.
Lança
fonte
2
Não tenho certeza do que é um coeficiente de caminho. Parece que B é um coeficiente de regressão que não seria adimensional. Seria em y unidades por 1 x unidade. No entanto, p = B sx / sy em que sx é o desvio padrão estimado em x dividido pelo desvio padrão estimado em ye ep é adimensional. Representa uma correlação estimada entre x e y. Lance se é isso que você pretendia, faça as alterações editando sua postagem.
Michael R. Chernick