Eu entendo o teste de hipótese bicaudal. Você tem (vs. ). O valor é a probabilidade de que gere dados pelo menos tão extremos quanto o que foi observado.
Eu não entendo o teste de hipótese unilateral. Aqui, (vs. ). A definição de valor-p não deveria ter mudado de cima: ainda deve ser a probabilidade de que gere dados pelo menos tão extremos quanto o que foi observado. Mas não sabemos , apenas que é delimitado por .
Então, ao invés disso, vejo textos nos dizendo para assumir que (não conforme ) e calcular a probabilidade de que isso gere dados pelo menos tão extremos quanto o observado, mas apenas em uma extremidade . Isso parece não ter nada a ver com as hipóteses, tecnicamente.
Agora, entendo que esse é um teste de hipóteses freqüentista, e que os freqüentadores não colocam nenhum prior a . Mas isso não significa apenas que as hipóteses são impossíveis de aceitar ou rejeitar, em vez de incluir o cálculo acima na imagem?
fonte
Respostas:
Essa é uma pergunta ponderada. Muitos textos (talvez por razões pedagógicas) abordam essa questão. O que realmente está acontecendo é que é uma "hipótese" composta em sua situação unilateral: na verdade, é um conjunto de hipóteses, não uma única. É necessário que para todas as hipóteses possíveis emH0 0 H0 0 , a chance da estatística de teste cair na região crítica deve ser menor ou igual ao tamanho do teste. Além disso, se o teste realmente atingir seu tamanho nominal (o que é bom para obter alta potência), o supremo dessas chances (assumidas todas as hipóteses nulas) deve ser igual ao tamanho nominal. Na prática, para testes simples de localização de um parâmetro envolvendo certas famílias "agradáveis" de distribuições, esse supremo é atingido para a hipótese com o parâmetro . Assim, como uma questão prática, todo o cálculo se concentra nessa única distribuição. Mas não devemos esquecer o resto do conjunto : essa é uma distinção crucial entre testes frente e verso e frente e verso (e entre "simples" e "composto"θ0 0 H0 0
Isso influencia sutilmente a interpretação dos resultados de testes unilaterais. Quando o nulo é rejeitado, podemos dizer que a evidência aponta contra o verdadeiro estado da natureza, sendo qualquer uma das distribuições em . Quando o nulo não é rejeitado, podemos apenas dizer que existe uma distribuição em H 0 que é "consistente" com os dados observados. Estamos não dizendo que todas as distribuições em H 0 são consistentes com os dados: longe disso! Muitos deles podem gerar probabilidades extremamente baixas.H0 0 H0 0 H0 0
fonte
Eu vejo o valor- como a probabilidade máxima de um erro do tipo I. Se θ ≪ θ 0 , a probabilidade de uma taxa de erro do tipo I pode ser efetivamente zero, mas também é assim. Ao olhar para o teste de uma perspectiva minimax, um adversário nunca se retiraria das profundezas do "interior" da hipótese nula, e o poder não deveria ser afetado. Para situações simples (o teste t , por exemplo), é possível construir um teste com uma taxa máxima garantida do tipo I, permitindo tais hipóteses nulas de um lado.p θ ≪ θ0 0 t
fonte
Você usaria um teste de hipótese unilateral se apenas os resultados em uma direção apoiarem a conclusão que você está tentando chegar.
Pense nisso em termos da pergunta que você está fazendo. Suponha, por exemplo, que você queira ver se a obesidade leva ao aumento do risco de ataque cardíaco. Você coleta seus dados, que podem consistir em 10 pessoas obesas e 10 não obesas. Agora, digamos que, devido a fatores de confusão não registrados, design experimental ruim ou má sorte, observe que apenas 2 das 10 pessoas obesas têm ataques cardíacos, em comparação com 8 das pessoas não obesas.
Agora, se você realizasse um teste de hipótese bidirecional com esses dados, concluiria que havia uma associação estatisticamente significativa (p ~ 0,02) entre obesidade e risco de ataque cardíaco. No entanto, a associação estaria na direção oposta àquela que você realmente esperava ver, portanto, o resultado do teste seria enganoso.
(Na vida real, um experimento que produziu um resultado tão contra-intuitivo pode levar a perguntas adicionais interessantes: por exemplo, o processo de coleta de dados pode precisar ser aprimorado ou pode haver fatores de risco anteriormente desconhecidos no trabalho, ou talvez a sabedoria convencional esteja simplesmente equivocada, mas essas questões não estão realmente relacionadas à questão restrita de que tipo de teste de hipótese usar.)
fonte
Você pode experimentar este exemplo de brinquedo em R, tente também diferentes números absolutos e combinações de cara e coroa:
fonte