Eu sou novo em estatística e atualmente lida com ANOVA. Realizo um teste ANOVA em R usando
aov(dependendVar ~ IndependendVar)
Eu recebo - entre outros - um valor F e um valor p.
Minha hipótese nula ( ) é que todas as médias de grupos são iguais.
Há muitas informações disponíveis sobre como F é calculado , mas não sei ler uma estatística F e como F e p estão conectados.
Então, minhas perguntas são:
- Como determino o valor F crítico para rejeitar ?
- Cada F tem um valor p correspondente, então ambos significam basicamente o mesmo? (por exemplo, se , H 0 é rejeitado)
r
anova
interpretation
JanD
fonte
fonte
summary(aov(dependendVar ~ IndependendVar)))
ousummary(lm(dependendVar ~ IndependendVar))
? Você quer dizer que todas as médias do grupo são iguais entre si e iguais a 0 ou apenas uma à outra?summary(aov...)
. Obrigado pelolm.*
, não sabia sobre isso :-) Não entendi o que você quer dizer com igual a 0. Se isso é curto para a minha hipótese 0, a hipótese precisaria de um valor e não testei em uma específica, então neste caso: apenas um para o outro!Respostas:
Para responder suas perguntas:
Você encontra o valor F crítico de uma distribuição F (aqui está uma tabela ). Veja um exemplo . Você deve ter cuidado com os graus de liberdade unidirecional ou bidirecional do numerador e denominador.
Sim.
fonte
A estatística F é uma razão de 2 medidas diferentes de variação para os dados. Se a hipótese nula for verdadeira, ambas são estimativas da mesma coisa e a proporção será em torno de 1.
O numerador é calculado medindo a variação das médias e se as médias verdadeiras dos grupos são idênticas, isso é uma função da variação geral dos dados. Mas se a hipótese nula for falsa e os meios não forem todos iguais, essa medida de variação será maior.
O denominador é uma média das variações da amostra para cada grupo, que é uma estimativa da variação geral da população (assumindo que todos os grupos tenham variações iguais).
Portanto, quando o nulo de todos os meios iguais for verdadeiro, as 2 medidas (com alguns termos extras para graus de liberdade) serão semelhantes e a proporção será próxima de 1. Se o nulo for falso, o numerador será grande em relação a o denominador e a razão serão maiores que 1. A pesquisa dessa relação na tabela F (ou calculando-a com uma função como pf em R) fornecerá o valor p.
Se você preferir usar uma região de rejeição a um valor-p, poderá usar a tabela F ou a função qf em R (ou outro software). A distribuição F possui 2 tipos de graus de liberdade. Os graus de liberdade do numerador são baseados no número de grupos que você está comparando (para uma via é o número de grupos menos 1) e os graus de liberdade do denominador são baseados no número de observações dentro dos grupos (para 1 a 1 como é o número de observações menos o número de grupos). Para modelos mais complicados, os graus de liberdade ficam mais complicados, mas seguem idéias semelhantes.
fonte
Você deve observar algumas outras coisas sobre a distribuição sob hipótese nula:
Isso é muito mais do que eu pretendia digitar, mas espero que isso cubra suas perguntas!
(Se você está se perguntando de onde os diagramas vieram, eles foram gerados automaticamente pelo meu pacote de estatísticas da área de trabalho, o Assistente .)
fonte