Estou tentando ver se as variáveis xey juntas ou separadamente afetam significativamente Q_7 (o histograma acima). Fiz um teste de normalidade Shapiro-Wilk e fiz o seguinte
shapiro.test(Q_7)
## data: Q_7
## W = 0.68439, p-value < 2.2e-16
Com esta distribuição, a seguinte regressão funcionará? Ou há outro teste que eu deveria estar fazendo?
lm(Q_7 ~ x*y)
regression
assumptions
kjetil b halvorsen
fonte
fonte
Q_7
. No momento, está fortemente inclinado para a direita. Verifique também as distribuições dos preditores.Respostas:
fonte
A resposta curta é sim.
lm
Se você assumir ainda que seus resíduos não estão correlacionados e que todos têm a mesma variação, o teorema de Gauss-Markov se aplica e o OLS é o melhor estimador linear e imparcial (AZUL).
Se seus resíduos estiverem correlacionados ou tiverem variações diferentes, o OLS ainda funcionará, mas poderá ser menos preciso, o que deve ser refletido na maneira como você relata os intervalos de confiança de suas estimativas (usando, digamos, erros padrão robustos ).
Se você também assume que seus resíduos são normalmente distribuídos, o OLS se torna assintoticamente eficiente, porque é equivalente à probabilidade máxima.
Portanto, a regressão pode funcionar melhor se seus dados forem normalmente distribuídos, mas ainda funcionará se não estiverem.
fonte