Qual é uma boa regra geral sobre como escolher a pergunta para a hipótese nula. Por exemplo, se eu quiser verificar se a hipótese B é verdadeira, devo usar B como nulo, B como hipótese alternativa ou NÃO B como nulo? Espero que a pergunta seja clara. Eu sei que isso tem algo a ver com o erro que eu quero minimizar (Tipo I?), Mas continuo esquecendo como vai, porque não tenho uma intuição clara criada para isso. Obrigado.
hypothesis-testing
Nestor
fonte
fonte
Respostas:
Uma regra geral de um bom conselheiro meu era definir a hipótese nula para o resultado que você não deseja que seja verdadeiro, isto é, o resultado cujo lado oposto você deseja mostrar.
Exemplo básico: suponha que você tenha desenvolvido um novo tratamento médico e queira mostrar que ele é realmente melhor que o placebo. Então você define a Hipótese Nula novo tratamento é igual ou pior que o placebo e Hipótese Alternativa H 1 : = o novo tratamento é melhor que o placebo.H0:= H1:=
Isso porque, no decorrer de um teste estatístico, você rejeita a Hipótese Nula (e favorece a Hipótese Alternativa) ou não pode rejeitá-la. Como seu "objetivo" é rejeitar a hipótese nula, você o define como o resultado que não deseja que seja verdadeiro.
Nota lateral: Estou ciente de que não se deve configurar um teste estatístico para distorcê-lo e quebrá-lo até que a Hipótese Nula seja rejeitada; a linguagem casual foi usada apenas para facilitar a lembrança dessa regra.
Isso também pode ser útil: Qual é o significado dos valores de p nos valores estatísticos? e / ou O que é uma boa introdução ao teste de hipóteses estatísticas para cientistas da computação?
fonte
Se a hipótese B é a hipótese interessante, você pode tomar not-B como hipótese nula e controlar, sob o nulo, a probabilidade do erro tipo I de rejeitar erroneamente o not-B no nívelα . Rejeitar not-B é então interpretado como evidência a favor de B, porque controlamos o erro do tipo I; portanto, é improvável que not-B seja verdadeiro. Confuso ...?
Tomemos o exemplo de tratamento versus nenhum tratamento em dois grupos de uma população. A hipótese interessante é que o tratamento tem um efeito, ou seja, existe uma diferença entre o grupo tratado e o grupo não tratado devido ao tratamento. A hipótese nula é que não há diferença, e controlamos a probabilidade de rejeitar erroneamente essa hipótese. Assim, controlamos a probabilidade de concluir erroneamente que há um efeito de tratamento quando não há efeito de tratamento. O erro do tipo II é a probabilidade de aceitar incorretamente o nulo quando há um efeito de tratamento.
Nenhuma das estruturas está livre de problemas, e a terminologia é frequentemente confusa. Posso recomendar o livro Evidência estatística: um paradigma de probabilidade de Richard M. Royall para um tratamento claro dos diferentes conceitos.
fonte
A resposta "freqüentista" é inventar uma hipótese nula da forma "não B" e depois argumentar contra "não B", como na resposta de Steffen. Este é o equivalente lógico de se argumentar "Você está errado, portanto devo estar certo". Esse é o tipo de raciocínio usado pelo político (ou seja, o outro partido é ruim, portanto somos bons). É bastante difícil lidar com mais de uma alternativa nesse tipo de raciocínio. Isso ocorre porque o argumento "você está errado, logo estou certo" só faz sentido quando não é possível que ambos estejam errados, o que certamente pode acontecer quando há mais de uma hipótese alternativa.
A resposta "bayesiana" é simplesmente calcular a probabilidade da hipótese de que você está interessado em testar, dependendo de qualquer evidência que tenha. Sempre isso contém informações anteriores, que são simplesmente as suposições que você fez para tornar seu problema bem posicionado (todos os procedimentos estatísticos dependem de informações anteriores, os bayesianos apenas os tornam mais explícitos). Geralmente também consiste em alguns dados, e temos pelo teorema de bayes
fonte
A hipótese nula geralmente deve assumir que as diferenças em uma variável de resposta são devidas apenas a erros.
A
x
A
x
Não rejeitar esta hipótese nula seria interpretado como:
1) quaisquer diferenças
x
são devidas apenas a erros e nãoA
ou,2) que os dados são inadequados para detectar uma diferença mesmo que exista (consulte o erro Tipo 2 abaixo).
A
x
A
x
A
x
fonte