Enquanto estudava no meu curso de estatísticas, eu estava tentando entender a diferença entre testes de hipótese uni e bicaudal. Especificamente, por que o teste de uma cauda rejeita o nulo, enquanto o teste de duas caudas não?
Um exemplo:
hypothesis-testing
Lu Ci
fonte
fonte
Respostas:
Um teste bicaudal testa a diferença em qualquer direção. Assim, o valor de P seria a área sob a distribuição t à direita de t = 1,92 MAIS a área sob a distribuição à esquerda de t = -1,92. Isso é o dobro da área do teste de uma cauda e, portanto, o valor de P é duas vezes maior.
Se você usa um teste de uma cauda, obtém poder, mas com o custo potencial de ter que ignorar uma diferença que está na direção oposta à hipotetizada antes da obtenção dos dados. Se você obteve os dados antes de formalizar e registrou a hipótese, realmente deveria usar um teste bicaudal. Da mesma forma, se você estiver interessado em um efeito em qualquer direção, use um teste bicaudal. De fato, você pode usar um teste bicaudal como sua abordagem padrão e usar apenas um teste unilateral no caso incomum em que um efeito só pode existir em uma direção.
fonte
A área sob a curva não é duas vezes maior para um teste bicaudal: para um teste bicaudal com p crítico = 0,05, você está testando com que frequência os dados observados podem ser obtidos a partir de 2,5% inferior ou superior de uma distribuição nula ( 0,05 no total). Com um teste unilateral, você está testando com que frequência os dados viriam da extremidade extrema de 5% de uma cauda (pré-especificada).
Em parte, a resposta para sua pergunta é uma das práticas: a maioria dos pesquisadores considera improvável a replicação de experimentos que relatam testes de uma cauda (ou seja, eles assumem que o pesquisador escolheu isso para que suas estatísticas sejam "significativas").
No entanto, existem casos de uso válidos. Se você souber que qualquer resultado na direção inversa é impossível de acordo com a teoria que está sendo testada, então, como um comentário anterior observou, você pode especificar isso com antecedência e realizar um teste unilateral. A maioria das pessoas, novamente, ainda vê isso de maneira cautelosa.
fonte
Isso leva à pergunta: por que usar estatísticas de teste diferentes? O motivo é que as alternativas são diferentes e, portanto, o poder de cada estatística de teste é diferente. Especificamente, o poder de cada teste é reduzido (desde que utilizemos o mesmo significado) se usarmos a estatística de teste e a região de rejeição do outro teste.
fonte