Interpretação de preditores transformados em log em regressão logística
15
Um dos preditores no meu modelo logístico foi transformado em log. Como você interpreta o coeficiente estimado do preditor transformado em log e como calcula o impacto desse preditor no odds ratio?
Obrigado por toda sua ajuda. Mais um esclarecimento. Na verdade, se eu mudar para o log base 2-, de acordo com a resposta anterior, faz sentido intuitivo que uma duplicação no preditor resulte em uma mudança de% de% no resultado.
Mp77
Respostas:
16
Se você exponenciar o coeficiente estimado, obterá uma razão de chances associada a um aumento de vezesb no preditor, em que é a base do logaritmo usado ao transformar o preditor em log.b
Normalmente, escolho levar os logaritmos para a base 2 nessa situação, para poder interceptar o coeficiente exponencial como uma razão de chances associada a uma duplicação do preditor.
Interessante. Eu sempre uso logs naturais porque muitos dos coeficientes tendem a ser próximos de zero e, em seguida, podem ser interpretados como diferenças proporcionais (relativas). Isso não é possível em nenhuma outra base de logaritmo. Vejo algum mérito em usar outras bases, mas acho que você precisa esclarecer sua resposta, porque prima facie sua interpretação não usa o valor do coeficiente!
whuber
@whuber desculpe o que significa prima facie ? Primeira cara ??
@gung é completamente correto, mas, no caso de você não decidir mantê-lo, você pode interpretar o coeficiente tem de ter um efeito sobre cada múltiplo do IV, em vez de cada adição do IV.
Um IV que freqüentemente deve ser transformado é a renda. Se você incluísse o valor não transformado, cada (digamos) aumento de $ 1.000 na renda teria um efeito no quociente de probabilidade, conforme especificado pelo quociente de chance. Por outro lado, se você anotasse o log (10) da receita, cada aumento de 10 vezes na receita teria o efeito sobre o odds ratio especificado no odds ratio.
Faz sentido fazer isso pela renda porque, de várias maneiras, um aumento de US $ 1.000 na renda é muito maior para quem ganha US $ 10.000 por ano do que alguém que ganha US $ 100.000.
Uma observação final - embora a regressão logística não faça suposições de normalidade, mesmo a regressão OLS não faz suposições sobre as variáveis, faz suposições sobre o erro, conforme estimado pelos resíduos.
+1, bons pontos. Suponho que poderia ter sido mais completo. Além disso, desliguei o mathjax inadvertido colocando uma barra invertida "\" imediatamente antes dos cifrões. Espero que você não se importe.
gung - Restabelece Monica
O que você quer dizer com 'regressão logística assume pressupostos sobre os erros'?
Não, a regressão OLS faz suposições sobre os erros. Foi o que eu disse.
Peter Flom - Restabelece Monica
3
Esta resposta é adaptada de The Statistical Sleuth, de Fred L. Ramsey e Daniel W. Schafer.
Se a sua equação do modelo for:
log(p/(1−p))=β0+βlog(X)
kXkβ
Por exemplo, eu tenho o seguinte modelo de presença de escaras regredidas no tempo de permanência em um hospital.
Respostas:
Se você exponenciar o coeficiente estimado, obterá uma razão de chances associada a um aumento de vezesb no preditor, em que é a base do logaritmo usado ao transformar o preditor em log.b
Normalmente, escolho levar os logaritmos para a base 2 nessa situação, para poder interceptar o coeficiente exponencial como uma razão de chances associada a uma duplicação do preditor.
fonte
@gung é completamente correto, mas, no caso de você não decidir mantê-lo, você pode interpretar o coeficiente tem de ter um efeito sobre cada múltiplo do IV, em vez de cada adição do IV.
Um IV que freqüentemente deve ser transformado é a renda. Se você incluísse o valor não transformado, cada (digamos) aumento de $ 1.000 na renda teria um efeito no quociente de probabilidade, conforme especificado pelo quociente de chance. Por outro lado, se você anotasse o log (10) da receita, cada aumento de 10 vezes na receita teria o efeito sobre o odds ratio especificado no odds ratio.
Faz sentido fazer isso pela renda porque, de várias maneiras, um aumento de US $ 1.000 na renda é muito maior para quem ganha US $ 10.000 por ano do que alguém que ganha US $ 100.000.
Uma observação final - embora a regressão logística não faça suposições de normalidade, mesmo a regressão OLS não faz suposições sobre as variáveis, faz suposições sobre o erro, conforme estimado pelos resíduos.
fonte
Esta resposta é adaptada de The Statistical Sleuth, de Fred L. Ramsey e Daniel W. Schafer.
Se a sua equação do modelo for:
Por exemplo, eu tenho o seguinte modelo de presença de escaras regredidas no tempo de permanência em um hospital.
fonte