Estou usando a quarta 1/4
transformação de energia root ( ) na minha variável de resposta, como resultado da heterocedasticidade. Mas agora não tenho certeza de como interpretar meus coeficientes de regressão.
Suponho que precisaria levar os coeficientes para a quarta potência quando eu retrocedesse (veja abaixo a saída de regressão). Todas as variáveis estão em unidades de dólar em milhões, mas eu gostaria de saber a variação do dólar em bilhões.
Enquanto mantém a outra variável independente constante, uma mudança de bilhão de dólares em taxas, em média, leva a uma mudança de 32
(ou 32.000 dólares) em cobranças. Eu tomo 0.000075223 * 1000
(para chegar a bilhões) ^ 4 = 0.000032
. Agora, multiplico esse número por 1 milhão ou 1 bilhão (a unidade original da variável dependente é em milhões)?
lm(formula = (Collections^(1/4)) ~ Fees + DIR)
Estimate Std. Error t value Pr(>|t|)
(Intercept) 2.094573355 0.112292375 18.653 0.0000000000000151
Fees **0.000075223 **0.000008411 8.943 0.0000000131878713
DIR 0.000022279 0.000004107 5.425 0.0000221138881913
fonte
Respostas:
A melhor solução é, desde o início, escolher uma re-expressão que tenha um significado no campo de estudo.
(Por exemplo, quando a regredir pesos corporais contra factores independentes, é provável que seja uma raiz cúbica ( potência) ou raiz quadrada ( 1 / 2 potência) será indicado. Notando que o peso é um bom substituto para o volume, o cubo raiz é um comprimento representando um tamanho linear característica Este lhe confere um sentido intuitivo, potencialmente interpretável Embora a própria raiz quadrada não tem tal interpretação clara, que é próximo ao.. 2 / 3 de energia, o qual tem dimensões de área de superfície : ele pode corresponder à área total da pele.)1/3 1/2 2/3
O quarto poder está suficientemente próximo do logaritmo que você deve considerar usar o log , cujos significados são bem entendidos. Mas, às vezes, realmente descobrimos que uma raiz cúbica ou quadrada ou um poder fracionário desse tipo faz um ótimo trabalho e não tem interpretação óbvia. Então, devemos fazer um pouco de aritmética.
O modelo de regressão mostrado na pergunta envolve uma variável dependente ("Coleções") e duas variáveis independentes X 1 ("Taxas") e X 2 ("DIR"). Postula queY X1 X2
O código estima como b 0 = 2,094573355 , β 1 como b 1 = 0,000075223 e β 2 como b 2 = 0,000022279 . Também presume que ε é normal com média zero e estima sua variação comum (não mostrada). Com estas estimativas, o valor ajustado de Y 1 / 4 éβ0 b0=2.094573355 β1 b1=0.000075223 β2 b2=0.000022279 ε Y1/4
"Interpretar" os coeficientes de regressão normalmente significa determinar qual mudança na variável dependente é sugerida por uma determinada alteração em cada variável independente. Essas mudanças são os derivados , que a Regra da Cadeia nos diz que são iguais a 4 β i Y 3 . Incluiríamos as estimativas e diríamos algo comodY/dXi 4βiY3
A dependência da interpretação de e X 2 não é simplesmente expressa em palavras,X1 X2 ao contrário das situações sem transformação de (uma mudança de unidade em X i está associada a uma mudança de b i em Y ) ou com o logaritmo (um alteração percentual em X i está associada com b i alteração percentual em Y ). No entanto, mantendo a primeira forma da interpretação e computando 4 b 1 = 4 × 0.000075223 = 0.000301Y XEu bEu Y XEu bEu Y 4 b1 4 × 0.000075223 0.000301 , podemos afirmar algo como
Ao tomar outros do que o quarto raízes - por exemplo, quando se usa como a resposta em vez de Y si, com p diferente de zero - simplesmente substituir todas as aparências de " 4 " nesta análise por " 1 / p ".Yp Y p 4 1 / p
fonte
Uma alternativa à transformação aqui é usar um modelo linear generalizado com a função de link power e power 1/4. Que família de erros usar está aberta, o que lhe dá mais flexibilidade do que você tem com regressão linear e uma suposição de normalidade condicional. Uma grande vantagem desse procedimento é que as previsões são produzidas automaticamente na escala de medição original, portanto não há questão de retrotransformação.
fonte
Eu vi artigos usando coeficientes de regressão da raiz quártica ao pensar em mudanças percentuais, evitando registros (e descartando observações).
Se estivermos interessados em usar raízes quárticas para calcular alterações percentuais, sabemos que:
fonte