Esta pode ser uma pergunta básica, mas eu queria saber por que um valor em um modelo de regressão pode simplesmente ser elevado ao quadrado para dar uma figura da variação explicada?
Eu entendo que coeficiente pode dar a força de um relacionamento, mas não entendo como o simples quadrado desse valor fornece uma medida da variação explicada.
Alguma explicação fácil para isso?
Muito obrigado por ajudar com isso!
regression
correlation
r-squared
David
fonte
fonte
Respostas:
Mão-wavingly, a correlação pode ser pensado como uma medida do ângulo entre dois vectores, o vector dependente Y e o vector independente X . Se o ângulo entre os vetores é θ , a correlação R é cos ( θ ) . A parte de Y explicada por X é de comprimento | | Y | | cos ( θ ) e é paralelo a X (ou a projeção de Y em X | | Y | |R Y X θ R cos(θ) Y X ||Y||cos(θ) X Y X ). A parte que não é explicada é de comprimento e é ortogonal a X . Em termos de variâncias, temos
σ 2 Y = σ 2 Y cos 2 ( θ ) + σ 2 Y sin 2 ( θ )
onde o primeiro termo à direita é a variância explicada e o segundo a variância inexplicável. A fracção que é explicado é, portanto, R 2 , não I .||Y||sin(θ) X
fonte