Suponha que seu conjunto de dados consista em um conjunto para você deseje observar a dependência de em .i = 1 , … , n y x( xEu, yEu)i = 1 , … , nyx
Suponha que você encontre os valores e de e que minimizem a soma residual dos quadrados
Em seguida, você considera como o valor previsto para qualquer valor (não necessariamente já observado) . Isso é regressão linear. β αβ n Σ i=1(yi-(α+βxi))2. Y = α + β xyxα^β^αβ
∑i =1n(yEu- ( α + βxEu)))2.
y^= α^+β^xyx
Agora considere decompor a soma total de quadrados
com graus de liberdade, em partes "explicadas" e "inexplicáveis":
com e graus de liberdade, respectivamente. Essa é a análise de variância, e então consideramos coisas como estatísticas
este n-1 n Σ i = 1 ( ( α + β x i ) - ˉ y ) 2 ⏟ explicado+ n Σ i = 1 ( y i - ( α + β x i ) ) 2 ⏟ inexplicável. 1n-2F=Σ n i =
∑i = 1n( yEu- y¯)2onde você¯= y1+ ⋯ + ynn
n - 1∑i = 1n( ( α^+ β^xEu) - y¯)2explicado + ∑ i = 1n( yEu- ( α^+ β^xEu) ))2inexplicável.
1n - 2β=0F= ∑ni = 1( ( α^+ β^xEu) - y¯)2/ 1∑ni = 1( yEu- ( α^+ β^xEu) ))2/ (n-2).
A estatística F testa a hipótese nula .
β= 0
Um frequentemente primeiros encontros, o termo "análise de variância" quando o indicador é categórico, de modo que você está ajustando o modelo
onde identifica qual categoria é o valor do indicador. Se houver categorias, você obteria graus de liberdade no numerador na estatística F e, geralmente, graus de liberdade no denominador. Mas a distinção entre regressão e análise de variância ainda é a mesma para esse tipo de modelo. i k k - 1 n - k
y= α + βEu
Eukk - 1n - k
Alguns pontos adicionais:
- Para alguns matemáticos, o relato acima pode fazer parecer que todo o campo é apenas o que é visto acima, portanto, pode parecer misterioso que tanto a regressão quanto a análise de variância sejam áreas de pesquisa ativas. Há muita coisa que não cabe em uma resposta apropriada para postar aqui.
- Há um erro popular e tentador, que é chamado de "linear" porque o gráfico de é uma linha. Isso é falso. Uma das minhas respostas anteriores explica por que ainda é chamada de "regressão linear" quando você está ajustando um polinômio por meio de mínimos quadrados.y= α + βx
A principal diferença é a variável de resposta. Enquanto a regressão logística lida com uma resposta binária na análise de regressão linear e também com a regressão não linear, a variável de resposta é contínua. Você tem uma (s) variável (s) (também conhecida como covariável (s)) que têm um relacionamento funcional com a variável de resposta contínua. Na análise de variância, a resposta é contínua, mas pertence a algumas categorias diferentes (por exemplo, grupo de tratamento e grupo de controle). Na análise de variância, você procura diferença na resposta média entre os grupos. Na regressão linear, você observa como a resposta muda à medida que as covariáveis mudam. Outra maneira de observar a diferença é dizer que, na regressão, as covariáveis são contínuas, enquanto na análise de variância elas são um conjunto discreto de grupos.
fonte
A análise de variância (ANOVA) é um corpo de método estatístico para analisar observações assumidas como sendo da estrutura
ie Onde D é matriz de dispersão ou matriz de variância-covariância.E( yn × 1) = Xβ, D ( y) = σ2Eun
, em que os coeficientes { } são os valores das variáveis do contador ou do indicador que se referem à presença ou ausência dos efeitos { } nas condições sob as quais as observações são feitas: { } é o número de vezes que ocorre na i-ésima observação e geralmente é ou . Em geral, na análise de variância, todos os fatores são tratados qualitativamente. β j x i j β j 0 1xeu j βj xeu j βj 0 0 1
Se { } são valores assumidos nas observações, não por variáveis do contador, mas por variáveis contínuas como = tempo, = temperatura, , etc., temos um caso de * análise de regressão. Em geral, na análise de regressão todos os fatores são quantitativos e tratados quantitativamente. t T t 2 , e - Txeu j t T t2, e- T
Principalmente, esses dois são dois tipos de análise.
fonte
Na análise de regressão, você tem uma variável fixa e deseja saber como a variável vai com a outra variável.
Na análise de variância, você deseja saber, por exemplo: Se esse alimento animal específico influencia o peso dos animais ... ASSIM, um var fixo e a influência nos outros.
fonte