Aqui, a interpretação errônea da suposição de normalidade na regressão linear é discutida (que a 'normalidade' refere-se ao X e / ou Y ao invés dos resíduos), e o pôster pergunta se é possível ter X e Y distribuídos normalmente. e ainda tem resíduos normalmente distribuídos.
Minha pergunta é: normalmente são distribuídos X e Y com maior probabilidade de resultar em resíduos normalmente distribuídos? Houve muitos posts relacionados, mas não acredito que alguém tenha feito essa pergunta especificamente.
Sei que talvez esse seja um ponto trivial se houver apenas uma regressão a ser feita, mas menos se houver vários testes. Digamos que eu tenho 100 variáveis X, todas com a mesma inclinação e quero testá-las todas. Se eu os transformasse todos em uma distribuição normal, seria provável que eu tivesse menos variáveis X que precisassem reexaminar (com transformação diferente / nenhuma) devido a resíduos distribuídos normalmente, ou uma transformação pré-regressão seria totalmente arbitrária?
Respostas:
Para saber mais sobre como transformações não lineares podem alterar o modelo e as perguntas que o modelo responde (com ênfase na transformação de log), pode ajudá-lo a ler esses excelentes tópicos de CV:
R
Nas parcelas, vemos que ambos os marginais parecem razoavelmente normais, e a distribuição conjunta parece razoavelmente bivariada. No entanto, a uniformidade dos resíduos aparece em seu gráfico qq; as duas caudas caem muito rapidamente em relação a uma distribuição normal (como de fato devem).
fonte
A resposta curta está na clássica Teoria da Regressão Simples, X é fixo e assumido conhecido (veja, por exemplo, http://www.theanalysisfactor.com/the-distribution-of-independent-variables-in-regression-models-2/ ), mesmo sem nenhum erro de medição, seu beta de mínimos quadrados pode ser tendencioso e até inconsistente (consulte https://www.google.com/url?sa=t&source=web&rct=j&ei=Bd3sU4_kHfPjsATAm4LADA&url=https://files.nyu .edu / mrg217 / public / measure_handouts.pdf & cd = 2 & ved = 0CCMQFjAB & usg = AFQjCNF_pZvocW1SzInQPYpQTifUsQ36kQ & sig2 = 4lAnOQO23FiZbZ7323jOzA ).
No que diz respeito a transformar X em uma variável, a Wikipedia, sobre o teorema de Gauss-Markov, afirma muito brevemente, para citar:
"Na maioria dos tratamentos de OLS, os dados X são considerados fixos. Essa suposição é considerada inadequada para uma ciência predominantemente não experimental como a econometria. [2] Em vez disso, as suposições do teorema de Gauss-Markov são declaradas condicionais em X "
que eu li como uma grande transformação desagradável da ciência para a arte, ou arte / ciência.
fonte