Que pergunta a ANOVA responde?

9

Eu quero aprender ANOVA. Antes de começar a aprender como o algoritmo funciona (que cálculos precisam ser feitos) e por que ele funciona, primeiro gostaria de saber que problema realmente solucionamos com o ANOVA ou qual resposta tentamos responder. Em outras palavras: O que é entrada e o que é saída do algoritmo?

Eu entendo o que usamos como entrada. Temos um conjunto de números. Cada número vem com valores de uma ou mais variáveis ​​categóricas (também conhecidas como "fatores"). Por exemplo:

+------------+------------+-------+
|   factor 1 |   factor 2 | value |
+------------+------------+-------+
|     "A"    |     "a"    |  1.0  |
|     "A"    |     "a"    |  2.4  |
|     "A"    |     "b"    |  0.3  |
|     "A"    |     "b"    |  7.4  |
|     "B"    |     "a"    |  1.2  |
|     "B"    |     "a"    |  8.4  |
|     "B"    |     "b"    |  0.4  |
|     "B"    |     "b"    |  7.2  |
+------------+------------+-------+

É correto dizer que a ANOVA calcula o valor p da hipótese nula que afirma que não há efeito dos fatores na média dos valores? Em outras palavras, fornecemos os dados acima para o algoritmo e, como resultado, obtemos o valor-p da hipótese nula?

Se for esse o caso, que medida usamos realmente para calcular o valor-p. Por exemplo, podemos dizer que, dada a hipótese nula M, pode ser tão alta quanto a observada (ou até maior) apenas por acaso em 1% dos casos. O que é M?

Também não investigamos fatores na ANOVA separadamente? A ANOVA pode dizer que o fator_1 tem um efeito, mas o fator_2 não? A ANOVA pode dizer que, para um dado fator, os valores correspondentes ao valor "A", "B" e "C" são estatisticamente indistinguíveis (têm a mesma média, por exemplo), mas o valor "D" tem efeito?

romano
fonte

Respostas:

6

ANOVA significa "Análise de Variância". Sem surpresa, ele analisa a variação.

Sejamos um pouco mais explícitos. Suas observações exibirão alguma variação. Se você agrupar suas observações pelo fator 1, a variação nos grupos definidos pelo fator 1 será menor que a variação geral. O fator 1 "explica a variação".

No entanto, isso não é suficiente para concluir que o fator 1 realmente tem um relacionamento com suas observações ... porque agrupar por qualquer coisa que "explique" a variação. O bom é que sabemos quanta variação será explicada sob a hipótese nula de que seu fator, de fato, não tem nada a ver com suas observações. Essa quantidade de variação explicada sob o nulo é descrita por uma distribuiçãoF

Assim, a estratégia na ANOVA é estimar a variação geral e a variação dentro dos grupos (usando somas de quadrados) e tomar proporções dessas variações estimadas. Essa proporção é a estatísticaEm seguida, comparamos essa estatística com o valor crítico da distribuição em um teste unilateral, produzindo seu valor . O número de níveis de fator entra em um parâmetro da distribuição (mais níveis de fator explicam mais variação sob a hipótese nula), e o número de observações e o número de níveis entra no outro. Esta pergunta anterior pode ser útil.FFFpF

(Por que um teste unilateral? Porque, como acima, qualquer agrupamento explica alguma variação, portanto, faz sentido verificar se o seu fator explica uma quantidade significativamente grande de variação.)

A seção "Exemplo motivador" da entrada da Wikipedia fornece algumas ilustrações muito agradáveis ​​de fatores que explicam muito pouco, alguns e grande parte da variação geral.

ANOVA bidirecional e interações, como no seu exemplo, bem como ANCOVA, são apenas generalizações sobre esse tema. Em cada caso, investigamos se a adição de alguma variável explicativa explica uma quantidade significativamente grande de variação.

Uma vez que tenhamos um teste geral significativo , podemos examinar se as observações de determinados níveis de fatores são significativamente diferentes das demais em testes post-hoc . Por exemplo, D pode ser diferente de A, B e C, mas esses podem não ser significativamente diferentes um do outro. Você normalmente usará testes para isso. Esta pergunta anterior pode ser útil, assim como esta .Ft

Stephan Kolassa
fonte
Portanto, usamos todo o número para calcular a variação geral , calculamos as variações para cada grupo e finalmente combinamos todas essas variações (provavelmente também com os tamanhos dos grupos) para obter a "medida": . Em seguida, calculamos a probabilidade de M ser tão grande quanto possível ou até maior, pressupondo que a hipótese nula esteja correta. VviM=M(V,v1,v2,...,vk,n1,n2,...,nk)
Roman
Exatamente. é a sua estatísticaAqui está a fórmula real. MF
Stephan Kolassa
Para ser sincero, ainda estou um pouco confuso. Tanto quanto eu entendi, a ANOVA retorna o valor p da hipótese nula. Por outro lado, no "Exemplo motivador" da Wikipedia, pode-se concluir que a ANOVA nos fornece o melhor fator (ou uma combinação de fatores) que "explica" os dados da melhor maneira. Assim, no exemplo, a ANOVA diz que a raça é o melhor fator para explicar o peso dos cães.
Roman
11
"Melhor" está carregado. Isso entra no território da seleção de modelo por etapas com base em valores de p, e isso é problemático. Não leia muito sobre o exemplo motivador. A melhor coisa é a descrição da variação explicada (zero, um pouco, muito). Melhor descer e ler sobre como a estatística é calculada com base em somas de quadrados e lembre-se de que essas somas de quadrados são apenas estimadores de variações. F
Stephan Kolassa