Estou ciente de várias perguntas relacionadas aqui (por exemplo, terminologia de teste de hipótese em torno de nulo , é possível provar uma hipótese nula? ), Mas não sei a resposta definitiva para minha pergunta abaixo.
Suponha um teste de hipótese em que queremos testar se uma moeda é justa ou não. Temos duas hipóteses:
Suponha que usemos um nível de significância de 5%, existem dois casos possíveis:
- Quando obtemos os dados e descobrimos que o valor p é menor que 0,05, dizemos "Com nível de significância 5%, rejeitamos ".
- O valor p é maior que 0,05; então dizemos "Com nível de significância de 5%, não podemos rejeitar ".
Minha pergunta é:
No caso 1, é correto dizer "aceitamos "?
Intuitivamente, e pelo que aprendi no passado, sinto que "aceitar" qualquer coisa como resultado do teste de hipóteses está sempre incorreto. Por outro lado, nesse caso, como a união em de cobre todo o "espaço", "rejeite " e "aceita " são exatamente iguais para mim. Em outro pensamento, também posso pensar na seguinte idéia, que diz que é incorreto dizer "nós aceitamos ":
Temos uma evidência forte o suficiente para acreditar que não é verdadeira, mas podemos não ter uma evidência forte o suficiente para acreditar que é verdadeira. Portanto, "rejeitar " não implica automaticamente "aceitar "
Então, qual é a resposta certa?
fonte
"Reject the null hypothesis"
e"Fail to reject the null hypothesis"
. Como um aparte, você pode querer verificar para fora as idéias de Karl Popper ...Respostas:
IMO (como not-a-lógico ou formalmente treinados estatístico per se ), não se deve tomar qualquer desta linguagem muito a sério. Mesmo rejeitar um nulo quando p <0,001 não torna o nulo falso sem dúvida. Qual é o mal em "aceitar" a hipótese alternativa em um sentido igualmente provisório? Parece-me uma interpretação mais segura do que "aceitar o nulo" no cenário oposto (ou seja, um p grande e insignificante ), porque a hipótese alternativa é muito menos específica. Por exemplo, dado , se p = .06, ainda há 94% de chance de que estudos futuros encontrem um efeito que seja pelo menos tão diferente do nulo *, então, aceitandoα=.05 o nulo não é uma aposta inteligente, mesmo que não seja possível rejeitá-lo. Por outro lado, se p = 0,04, pode-se rejeitar o nulo, que eu sempre entendi implicar em favor da alternativa. Por que não "aceitar"? A única razão que eu posso ver é o fato de que alguém pode estar errado, mas o mesmo se aplica ao rejeitar.
A alternativa não é uma afirmação particularmente forte, porque, como você diz, abrange todo o "espaço". Para rejeitar seu nulo, é necessário encontrar um efeito confiável em ambos os lados do nulo, de modo que o intervalo de confiança não inclua o nulo. Dado esse intervalo de confiança (IC), a hipótese alternativa é verdadeira: todos os valores dentro são desiguais ao nulo. A hipótese alternativa também é verdadeira para valores fora do IC, mas é mais diferente do valor nulo do que o valor mais extremamente diferente dentro do IC (por exemplo, se , não seria ' pode até ser um problema para a hipótese alternativa se ). Se você pode obter um IC como esse, então, novamente, o que não há para aceitar sobre isso, muito menos a hipótese alternativa?CI95%=[.6,.8] P(head)=.9
Pode haver algum argumento do qual eu desconheço, mas duvido que ficaria convencido. Pragmaticamente, pode ser prudente não escrever que você está aceitando a alternativa se houver revisores envolvidos, porque o sucesso com eles (como com as pessoas em geral) geralmente depende de não desafiar as expectativas de maneiras indesejáveis. De qualquer maneira, não há muito em jogo se você não aceitar "rejeitar" ou "rejeitar" muito estritamente como a verdade final do assunto. Eu acho que esse é o erro mais importante a evitar em qualquer caso.
Também é importante lembrar que o nulo pode ser útil, mesmo que seja provavelmente falso. No primeiro exemplo, mencionei onde p = 0,06, falhar em rejeitar o nulo não é o mesmo que apostar que é verdade, mas é basicamente o mesmo que julgar útil cientificamente. Rejeitá-lo é basicamente o mesmo que julgar a alternativa mais útil. Isso parece próximo o suficiente para "aceitação" para mim, especialmente porque não é uma hipótese muito aceitável.
BTW, esse é outro argumento para se concentrar nos ICs: se você pode rejeitar o nulo usando o raciocínio no estilo Neyman – Pearson, não importa o quanto menor que o p seja para rejeitar o nulo. Pode ser importante pelo raciocínio de Fisher, mas se você puder rejeitar o nulo em um nível de que funcione para você, poderá ser mais útil levar esse para frente em um IC, em vez de apenas rejeitar o nulo com mais confiança do que você precisa (uma espécie de "exagero" estatístico). Se você possui uma taxa de erro confortável com antecedência, tente usar essa taxa de erro para descrever o que você acha que o tamanho do efeito poderia estar dentro de umα α α α CI(1−α) . Isso é provavelmente mais útil do que aceitar uma hipótese alternativa mais vaga para a maioria dos propósitos.
* Outro ponto importante sobre a interpretação desse exemplo de valor p é que ele representa essa chance para o cenário em que é dado que o nulo é verdadeiro. Se o nulo for falso, como as evidências parecem sugerir neste caso (embora não suficientemente convincente para os padrões científicos convencionais), essa chance será ainda maior. Em outras palavras, mesmo que o nulo seja verdadeiro (mas não se sabe disso), não seria prudente apostar nesse caso, e a aposta é ainda pior se for falsa!
fonte
Assumindo que, jogando a moeda várias vezes, você obtém a sequência
(head, tail, head, head, head)
O que você realmente calcula com o teste de hipóteses é realmente
ℙ[ obtaining (head, tail, head, head, head) | ℙ(head) = 0.5 ]
Ou seja, você obtém uma resposta para a seguinte pergunta:
Supondo
H0: ℙ(head) = 0.5
que recebo a sequência(head, tail, head, head, head)
pelo menos 5% das vezes?Portanto, a pergunta é formulada de tal maneira que você simplesmente não consegue obter a resposta conforme formulada em
1. Is ℙ(head) ≠ 0.5 true
?Ambas as instruções não são mutuamente exclusivas. Não é porque uma proposição esteja comprovadamente errada que outra seja necessariamente verdadeira.
Portanto, no caso 1, a
is it correct to say "we accept H1"?
resposta é não e sua conclusão:parece certo para mim.
As teorias científicas são construídas apenas sobre um certo conjunto de proposições, até que uma delas se prove errada. Nessa linha, a idéia geral do teste de hipóteses é descartar uma contradição imediata de uma proposição por fatos prontamente disponíveis, mas ela não fornece uma prova disso.
fonte