Meu objetivo é usar os coeficientes derivados de pesquisas anteriores sobre o assunto para prever resultados reais, considerando um conjunto de variáveis independentes. No entanto, o trabalho de pesquisa lista apenas os coeficientes Beta e o valor t. Eu gostaria de saber se é possível converter os coeficientes padronizados em não padronizados.
Seria útil converter minhas variáveis independentes não padronizadas em variáveis padronizadas para calcular o valor previsto? Como eu retornaria a um valor previsto não padronizado (se isso é possível?)
Linha de amostra adicionada do papel:
Número de rotas de ônibus (linhas de ônibus) | 0,275 (beta) | 5,70 *** (valor t)
Também me foi dado sobre as variáveis independentes:
Número de rotas de ônibus (linhas de ônibus) | 12,56 (méd.) | 9,02 (DST) | 1 (min) | 53 (máximo)
Respostas:
Parece que o artigo usa um modelo de regressão múltipla no formulário
onde os são versões padronizadas das variáveis independentes; viz. ,ξi
com a média (como 12,56 no exemplo) e o desvio padrão (como 9,02 no exemplo) dos valores da variável variável ('linhas de linha' no exemplo). é a interceptação (se presente). Conectar esta expressão ao modelo ajustado , com seus "betas" escritos como (0,275 no exemplo) e fazer álgebra fornece as estimativass i i th x i β 0 ^ β imi si ith xi β0 βi^
Isso mostra que os coeficientes do no modelo (além do termo constante) são obtidos dividindo os betas pelos desvios padrão das variáveis independentes e que a interceptação é ajustada subtraindo uma combinação linear adequada dos betas.xi
Isso fornece duas maneiras de prever um novo valor a partir de um vetor de valores independentes:(x1,…,xp)
Usando as médias e os desvios padrão conforme relatado no artigo (não recalculado a partir de novos dados!), Calcule e conecte-os à fórmula de regressão conforme fornecida pelos betas ou, equivalente,mi si (ξ1,…,ξp)=((x1−m1)/s1,…,(xp−mp)/sp)
Conecte à fórmula algebricamente equivalente derivada acima.(x1,…,xp)
Se o documento estiver usando um Modelo Linear Generalizado , talvez você precise seguir esse cálculo aplicando a função "link" inversa a . Por exemplo, com a regressão logística, seria necessário aplicar a função logística para obter a probabilidade prevista ( é a probabilidade de log prevista).Y^ 1/(1+exp(−Y^)) Y^
fonte
fonte