Por que os erros do tipo II nos testes de hipóteses são considerados erros?

8

Estou lendo sobre erros de decisão no teste de hipóteses. Minha pergunta é por que um "erro tipo II" é considerado algum erro? Pelo que entendi, surge quando deixamos de rejeitar uma hipótese nula falsa. Quando falhamos em rejeitar a hipótese nula, significa simplesmente que não temos fortes evidências para rejeitá-la. Não estamos fazendo nenhum comentário sobre qual das duas hipóteses é verdadeira (ou falsa) - nenhuma delas pode ser verdadeira. Não estamos dizendo que a hipótese nula seja verdadeira. Portanto, por que essa conclusão é chamada de erro?

Sanket Kedia
fonte

Respostas:

5

É porque não estamos fazendo o que devemos fazer quando a hipótese alternativa é verdadeira. Por exemplo, não estamos usando o novo medicamento que é realmente melhor que o existente, mas não conseguimos provar.

Zahava Kor
fonte
Seguindo essa lógica, deixar de rejeitar uma hipótese nula verdadeira não deve ser um verdadeiro positivo. Deve ser um erro, porque não estamos fazendo o que devemos fazer quando a hipótese nula é verdadeira.
Sanket Kedia
1
Por que você diz isso? É claro que estamos fazendo o que devemos fazer quando a hipótese nula é verdadeira - estamos mantendo o comportamento atual, que é a coisa correta a ser feita sob sua suposição de que a hipótese nula é verdadeira.
Zahava Kor
Conectar o NHST às ações que normalmente acontecem, como Zahava Kor faz aqui, parece a maneira mais simples e direta de apreciar os erros do Tipo II como 'erros'. Em alguns contextos, como o do desenvolvimento de drogas que Zahava Kor cita especificamente, o NHST está incorporado em um plano de ação, de modo que o resultado epistêmico do teste determine ações. Em relação à medicina em geral, ajuda a apreciar o magnífico Six Dangerous Words JAMA da EBM de
David C. Norris
4

Como queremos usar a palavra "erro" é, em última análise, uma questão semântica, e pessoas razoáveis ​​podem discordar sobre se, e em que sentido, devemos considerar um falso negativo como um erro .

  • Por um lado, acho que você está certo de que um resultado não significativo realmente significa apenas que não temos informações suficientes para ter certeza de que a hipótese nula é falsa e que isso não implica logicamente que a hipótese nula é verdadeira ( cf., Por que os estatísticos dizem que um resultado não significativo significa "você não pode rejeitar o nulo" em vez de aceitar a hipótese nula? ). Portanto, dado o nível de confiança necessário em sua situação e o nível de ambiguidade em seus dados, você tomou a decisão certa no sentido de ter aplicado corretamente a regra que havia decidido.
  • Por outro lado, se você se colocar na posição de alguém que está planejando um estudo. Eles querem saber se o nulo é falso. Se for realmente falso, eles querem ir embora depois que o estudo for concluído, tendo rejeitado a hipótese nula. Em vez disso, eles permaneceriam incertos sobre o assunto e talvez precisassem projetar e executar outro estudo. Nessa perspectiva, não rejeitar um nulo falso é definitivamente um resultado subótimo.
- Reinstate Monica
fonte
3
+1. Mas pode ser apropriado trazer a questão de Fisher x Neyman-Pearson aqui (vou apontar para sua própria resposta legal: stats.stackexchange.com/questions/23142 ). O OP está fazendo a pergunta no que parece ser o paradigma dos pescadores. Mas o erro tipo II é um conceito do paradigma Neyman-Pearson. Portanto, acredito, a confusão do OP.
Ameba
1

A palavra 'falha' está próxima de 'erro'.

Para mim, o termo erro faz sentido, pois você pode calcular uma probabilidade de ocorrência (desde que você defina um certo tamanho mínimo de efeito que seria desejável detectar). E você deseja calcular essa probabilidade em situações em que deseja que ela seja pequena. Nessas situações, a falha seria considerada um erro.

Para mim, é muito simétrico com erros do tipo I.

Como os valores-p, que se relacionam ao erro do tipo I, você também pode calcular a probabilidade de (falsamente) não rejeitar a hipótese nula. Para um determinado tamanho de efeito e um determinado teste (por exemplo, número de medições), é possível calcular com que probabilidade essa 'falha' pode ocorrer.

Estes pensamentos não exigem que você definir um limite para a hipótese nula.

pαH0 0

Sextus Empiricus
fonte
1
Na verdade, o erro real é testar a hipótese.
Sextus Empiricus