Em termos simples, quais são os pressupostos da regressão linear?
Eu só quero saber quando posso aplicar um modelo de regressão linear ao nosso conjunto de dados.
linear-regression
Anvay Joshi
fonte
fonte
Respostas:
Existem três premissas principais (estatisticamente falando estatisticamente):
Existe uma relação linear entre as variáveis dependentes e os regressores (figura abaixo), o que significa que o modelo que você está criando realmente se ajusta aos dados.
Os erros ou resíduos dos dados são normalmente distribuídos e independentes um do outro.
Homocedasticidade. Isso significa que a variação em torno da linha de regressão é a mesma para todos os valores da variável preditora.
Atualização 2: A multicolinearidade não é uma suposição, mas sim uma verificação de sanidade, especialmente se a interpretabilidade do modelo for importante (obrigado Ricardo Cruz pelo comentário). A multicolinearidade ocorre quando as variáveis independentes não são independentes uma da outra. Multicolinearidade entre variáveis explicativas que podem levar a ajustes de parâmetros menos estáveis (obrigado KT. Por apontar isso)). Existem testes como matriz de correlação (correlação bivariada de Pearson), fator de inflação de variância que podem ser usados para verificar isso.
fonte
Homoscedasticity
um pouco melhor com um exemplo? Não está claro. Você marcou uma de minhas perguntas como uma duplicata, na qual eu estava procurando uma melhor visualização dela. Você pode explicar?