Quero incluir o termo e seu quadrado (variáveis preditoras) em uma regressão, porque presumo que valores baixos de tenham um efeito positivo na variável dependente e valores altos tenham um efeito negativo. O deve capturar o efeito dos valores mais altos. Portanto, espero que o coeficiente de seja positivo e o coeficiente de seja negativo. Além de , eu também incluo outras variáveis preditoras.
Li em alguns posts aqui que é uma boa idéia centralizar as variáveis nesse caso para evitar a multicolinearidade. Ao realizar uma regressão múltipla, quando você deve centralizar suas variáveis preditoras e quando deve padronizá-las?
Devo centralizar as duas variáveis separadamente (na média) ou devo centralizar e, em seguida, pegar o quadrado ou centralizar e incluir o original ?
É um problema se é uma variável de contagem?
Para evitar que seja uma variável de contagem, pensei em dividi-la por uma área definida teoricamente, por exemplo, 5 quilômetros quadrados. Isso deve ser um pouco semelhante ao cálculo da densidade de pontos.
Receio, porém, que, nessa situação, minha suposição inicial sobre o sinal dos coeficientes não se mantenha mais, como quando e
=
mas seria então menor porque .
Respostas:
Sua pergunta é de fato composta de várias sub-perguntas, que tentarei abordar da melhor maneira possível.
Considerando e é uma maneira de fazê-lo, mas você tem certeza de que seu teste é conclusivo? Você será capaz de concluir algo útil para todos os resultados possíveis da regressão? Penso que colocar a pergunta claramente de antemão pode ajudar, e fazer perguntas semelhantes e relacionadas também pode ajudar. Por exemplo, você pode considerar um limite de para o qual as inclinações de regressão são diferentes. Isso pode ser feito usando variáveis moderadoras . Se as diferentes inclinações (enquanto impõem a mesma interceptação) são compatíveis, você não tem diferença; caso contrário, forneceu a si próprio um argumento claro para a diferença.x 2 xx x2 x
Acho que essa pergunta não deve ser misturada à primeira e ao teste, e receio que centrar-se em torno de ou antecipadamente possa influenciar os resultados. Eu aconselho a não centralizar, pelo menos em um primeiro estágio. Lembre-se de que você provavelmente não morrerá de multicolinearidade, muitos autores argumentam que é apenas equivalente a trabalhar com um tamanho de amostra menor ( aqui e aqui ).x 2x x2
Sim, mas isso dependerá muito dos 2 primeiros pontos, então eu sugiro que você lide com uma coisa de cada vez. Não vejo razão para a regressão não funcionar sem essa transformação; portanto, aconselho que você a ignore por enquanto. Observe também que, ao dividir por um elemento comum, você está alterando a escala na qual , mas existem maneiras completamente diferentes de vê-lo, como escrevi acima, nas quais esse limite é considerado de maneira mais explícita.x2=x
fonte
Em geral, a centralização poderia ajudar a reduzir a multicolinearidade, mas "você provavelmente não morrerá de multicolinearidade" (consulte a resposta da predrofigueira).
Mais importante ainda, é necessário centralizar para tornar a interceptação significativa. No modelo simples , a interceptação é definida como o resultado esperado para . Se um valor de zero não for significativo, nem o itercept será. Muitas vezes, é útil centralizar a variável torno de sua média; nesse caso, o preditor tem a forma e a interceptação é o resultado esperado para um sujeito cujo valor em é igual à média .x = 0 x x ( x i - ˉ x ) α x i ˉ xyi=α+βxi+ε x=0 x x (xi−x¯) α xi x¯
Nesses casos, você deve centralizar e depois quadrado. Você não pode centralizar e separadamente, porque está regredindo o resultado em uma variável "nova" ; portanto, você deve essa nova variável. O que poderia centralizar significa?x x 2 ( x i - ˉ x ) x 2x x x2 (xi−x¯) x2
Você pode centralizar uma variável de contagem, se sua média for significativa , mas você pode apenas escalá- la. Por exemplo, se e "2" puderem ser uma linha de base, você pode subtrair 2: . A interceptação se torna o resultado esperado para um sujeito cujo valor em é igual a "2", um valor de referência.x=1,2,3,4,5 (xi−2)=−1,0,1,2,3 xi
Quanto à divisão, não há problema: seus coeficientes estimados seriam maiores! Gelman e Hill , §4.1, dão um exemplo:
Uma polegada é milímetros, então é . Uma polegada é emiles, então é . Mas essas três equações são totalmente equivalentes.51 1300 / 25,4 1,6 e - 5 81000000 1300 / 1,6 e - 525.4 51 1300/25.4 1.6e−5 81000000 1300/1.6e−5
fonte
Embora aprecie o tratamento de centralização e interpretação de coeficientes de outras pessoas, o que você descreveu aqui é simplesmente um efeito linear. Em outras palavras, o que você descreveu não indica nenhuma necessidade de testar o quadrado de x .
fonte