Como interpretar os coeficientes de regressão quando a resposta foi transformada pela 4ª raiz?

20

Estou usando a quarta 1/4transformação de energia root ( ) na minha variável de resposta, como resultado da heterocedasticidade. Mas agora não tenho certeza de como interpretar meus coeficientes de regressão.

Suponho que precisaria levar os coeficientes para a quarta potência quando eu retrocedesse (veja abaixo a saída de regressão). Todas as variáveis ​​estão em unidades de dólar em milhões, mas eu gostaria de saber a variação do dólar em bilhões.

Enquanto mantém a outra variável independente constante, uma mudança de bilhão de dólares em taxas, em média, leva a uma mudança de 32(ou 32.000 dólares) em cobranças. Eu tomo 0.000075223 * 1000(para chegar a bilhões) ^ 4 = 0.000032. Agora, multiplico esse número por 1 milhão ou 1 bilhão (a unidade original da variável dependente é em milhões)?

lm(formula = (Collections^(1/4)) ~ Fees + DIR)

                 Estimate      Std. Error  t value            Pr(>|t|)
(Intercept)   2.094573355     0.112292375   18.653  0.0000000000000151
Fees        **0.000075223   **0.000008411    8.943  0.0000000131878713
DIR           0.000022279     0.000004107    5.425  0.0000221138881913
user13968
fonte
4
Você pode ler isto: voltar-transformação-de-regressão-coeficientes .
gung - Restabelece Monica

Respostas:

24

A melhor solução é, desde o início, escolher uma re-expressão que tenha um significado no campo de estudo.

(Por exemplo, quando a regredir pesos corporais contra factores independentes, é provável que seja uma raiz cúbica ( potência) ou raiz quadrada ( 1 / 2 potência) será indicado. Notando que o peso é um bom substituto para o volume, o cubo raiz é um comprimento representando um tamanho linear característica Este lhe confere um sentido intuitivo, potencialmente interpretável Embora a própria raiz quadrada não tem tal interpretação clara, que é próximo ao.. 2 / 3 de energia, o qual tem dimensões de área de superfície : ele pode corresponder à área total da pele.)1/31/22/3

O quarto poder está suficientemente próximo do logaritmo que você deve considerar usar o log , cujos significados são bem entendidos. Mas, às vezes, realmente descobrimos que uma raiz cúbica ou quadrada ou um poder fracionário desse tipo faz um ótimo trabalho e não tem interpretação óbvia. Então, devemos fazer um pouco de aritmética.

O modelo de regressão mostrado na pergunta envolve uma variável dependente ("Coleções") e duas variáveis ​​independentes X 1 ("Taxas") e X 2 ("DIR"). Postula queYX1X2

Y1/4=β0+β1X1+β2X2+ε.

O código estima como b 0 = 2,094573355 , β 1 como b 1 = 0,000075223 e β 2 como b 2 = 0,000022279 . Também presume que ε é normal com média zero e estima sua variação comum (não mostrada). Com estas estimativas, o valor ajustado de Y 1 / 4 éβ0b0=2.094573355β1b1=0.000075223β2b2=0.000022279εY1/4

Y1/4^=b0+b1X1+b2X2.

"Interpretar" os coeficientes de regressão normalmente significa determinar qual mudança na variável dependente é sugerida por uma determinada alteração em cada variável independente. Essas mudanças são os derivados , que a Regra da Cadeia nos diz que são iguais a 4 β i Y 3 . Incluiríamos as estimativas e diríamos algo comodY/dXi4βiY3

As estimativas de regressão que uma unidade de variação em vai ser associadas com uma mudança em Y de 4 b i Y 3 = 4 b i ( b 0 + b 1 X 1 + b 2 X 2 ) 3 .XiY4biY^34bi(b0+b1X1+b2X2)3

A dependência da interpretação de e X 2 não é simplesmente expressa em palavras,X1X2 ao contrário das situações sem transformação de (uma mudança de unidade em X i está associada a uma mudança de b i em Y ) ou com o logaritmo (um alteração percentual em X i está associada com b i alteração percentual em Y ). No entanto, mantendo a primeira forma da interpretação e computando 4 b 1 = 4 × 0.000075223 = 0.000301YXEubEuYXEubEuY4b14×0,0000752230.000301, podemos afirmar algo como

Uma alteração de unidade nas taxas está associada a uma alteração nas coleções de vezes o cubo das coleções atuais; por exemplo, se as coleções atuais forem 10 , um aumento de unidade nas taxas será associado a um aumento de 0,301 nas coleções e se as coleções atuais forem 20 , o mesmo aumento de unidade será associado a um aumento de 2,41 nas coleções.0.000301100,301202,41


Ao tomar outros do que o quarto raízes - por exemplo, quando se usa como a resposta em vez de Y si, com p diferente de zero - simplesmente substituir todas as aparências de " 4 " nesta análise por " 1 / p ". YpYp41/p

whuber
fonte
12

Uma alternativa à transformação aqui é usar um modelo linear generalizado com a função de link power e power 1/4. Que família de erros usar está aberta, o que lhe dá mais flexibilidade do que você tem com regressão linear e uma suposição de normalidade condicional. Uma grande vantagem desse procedimento é que as previsões são produzidas automaticamente na escala de medição original, portanto não há questão de retrotransformação.

Nick Cox
fonte
4

Eu vi artigos usando coeficientes de regressão da raiz quártica ao pensar em mudanças percentuais, evitando registros (e descartando observações).

Se estivermos interessados ​​em usar raízes quárticas para calcular alterações percentuais, sabemos que:

Y^=(α+β^1X1+β^2X2)4dY^dX1=4β^1(α+β^1X1+β^2X2)3

YXX

dY^/dX1Y=4β^1α+β^1X1+β^2X2

YX

dY^dX1X1Y^=4β^1X1α+β^1X1+β^2X2

X

Y1/4

user68005
fonte