Interpretação dos valores-p produzidos pelo teste de Levene ou Bartlett para homogeneidade de variâncias

11

Eu executei o teste de Levene e Bartlett em grupos de dados de um de meus experimentos para confirmar que não estou violando a suposição da ANOVA de homogeneidade de variações. Gostaria de verificar com vocês que não estou fazendo suposições erradas, se você não se importa: D

O valor p retornado por ambos os testes é a probabilidade de que meus dados, se fossem gerados novamente usando variâncias iguais, seriam os mesmos. Assim, usando esses testes, para poder dizer que não viole a suposição de homogeneidade de variâncias da ANOVA, eu precisaria apenas de um valor-p superior ao nível alfa escolhido (digamos 0,05)?

Por exemplo, com os dados que estou usando atualmente, o teste de Bartlett retorna p = 0,57, enquanto o teste de Levene (eles chamam de teste do tipo Brown-Forsythe Levene) dá um p = 0,95. Isso significa que, não importa qual teste eu use, posso dizer que os dados atendem à suposição. Estou cometendo algum erro?

Obrigado.

leve
fonte

Respostas:

8

O valor-p do seu teste de significância pode ser interpretado como a probabilidade de observar o valor da estatística relevante como ou mais extremo que o valor que você realmente observou, dado que a hipótese nula é verdadeira. (observe que o valor p não faz referência a quais valores da estatística provavelmente estão sob a hipótese alternativa )

EDIT: na terminologia matemática, isso pode ser escrito como: onde é alguma função dos dados (a "estatística") e é o valor real de observado; denota as condições implícitas pela hipótese nula sobre a distribuição amostral de .

pvalue=Pr(T>Tobs|H0)
T Tobs T H0 T

Você nunca pode ter certeza de que suas suposições são verdadeiras, apenas se os dados observados são consistentes ou não com suas suposições . Um valor p fornece uma medida aproximada dessa consistência.

Um valor p não fornece a probabilidade de que os mesmos dados sejam observados, apenas a probabilidade de que o valor da estatística seja igual ou mais extremo ao valor observado, dada a hipótese nula.

probabilityislogic
fonte
Apenas uma nota sobre os valores-p (em relação ao meu comentário entre colchetes), pode muito bem ser que, no caso de você ter dados "incomuns" (digamos, valor-p de 0,0001). MAS também pode ser que seja ainda mais incomum sob a hipótese alternativa (digamos um valor p de quando você alterna a hipótese nula e alternativa). Eu acredito que isso pode acontecer quando a estatística não é suficiente para o teste de hipótese. 1030T
probabilityislogic
..continuar ... Também pode ser que você tenha dados muito "bons" (por exemplo, valor de p de 0,5). MAS a hipótese alternativa pode ser melhor (ou mais consistente) com esses dados (digamos valor p de 0,99999 quando as hipóteses nula e alternativa são trocadas).
probabilityislogic
5

Você está "no lado direito do valor-p". Eu apenas ajustaria sua afirmação levemente para dizer que, se os grupos tivessem variações iguais em suas populações, este resultado de p = 0,95 indica que a amostragem aleatória usando esses tamanhos n produziria variações tão distantes ou distantes 95% das vezes . Em outras palavras, estritamente falando, é correto expressar o resultado em termos do que diz sobre o hypothersis nulo, mas não em termos do que diz sobre o futuro.

rolando2
fonte
Lembro-me da interpretação do valor-p como (neste caso): ao assumir que as hipóteses nulas (ou seja, homogeneidade das variações) estão corretas, então a probabilidade de obter esse ou um resultado mais extremo (ou seja, ao contrário do nulo ) é 57% ou 95%. Seja como for, a conclusão é a mesma e correta.
Henrik
3

Enquanto os comentários anteriores estão 100% corretos, os gráficos produzidos para objetos de modelo em R fornecem um resumo gráfico desta pergunta. Pessoalmente, eu sempre acho os gráficos muito mais úteis que o valor p, pois é possível transformar os dados posteriormente e identificar as alterações imediatamente no gráfico.

richiemorrisroe
fonte
2
Bem dito, outra coisa é que um valor p não diz nada sobre o que fazer se a hipótese nula for "rejeitada", mas um gráfico dos dados fornece uma pista sobre o problema
probabilityislogic