Como especificar a hipótese nula no teste de hipótese

15

Qual é uma boa regra geral sobre como escolher a pergunta para a hipótese nula. Por exemplo, se eu quiser verificar se a hipótese B é verdadeira, devo usar B como nulo, B como hipótese alternativa ou NÃO B como nulo? Espero que a pergunta seja clara. Eu sei que isso tem algo a ver com o erro que eu quero minimizar (Tipo I?), Mas continuo esquecendo como vai, porque não tenho uma intuição clara criada para isso. Obrigado.

hypothesis-testing Nestor
fonte

Gente ... excelentes respostas. Tudo útil. Ainda me surpreende quando recebo esse nível de colaboração na Web, apenas porque as pessoas estão interessadas. uau ... obrigado!

Nestor

17

Uma regra geral de um bom conselheiro meu era definir a hipótese nula para o resultado que você não deseja que seja verdadeiro, isto é, o resultado cujo lado oposto você deseja mostrar.

Exemplo básico: suponha que você tenha desenvolvido um novo tratamento médico e queira mostrar que ele é realmente melhor que o placebo. Então você define a Hipótese Nula novo tratamento é igual ou pior que o placebo e Hipótese Alternativa novo tratamento é melhor que o placebo. $H_0:=$ $H_1:=$

Isso porque, no decorrer de um teste estatístico, você rejeita a Hipótese Nula (e favorece a Hipótese Alternativa) ou não pode rejeitá-la. Como seu "objetivo" é rejeitar a hipótese nula, você o define como o resultado que não deseja que seja verdadeiro.

Nota lateral: Estou ciente de que não se deve configurar um teste estatístico para distorcê-lo e quebrá-lo até que a Hipótese Nula seja rejeitada; a linguagem casual foi usada apenas para facilitar a lembrança dessa regra.

Isso também pode ser útil: Qual é o significado dos valores de p nos valores estatísticos? e / ou O que é uma boa introdução ao teste de hipóteses estatísticas para cientistas da computação?

Steffen
fonte

6

Se a hipótese B é a hipótese interessante, você pode tomar not-B como hipótese nula e controlar, sob o nulo, a probabilidade do erro tipo I de rejeitar erroneamente o not-B no nível $\alpha$ . Rejeitar not-B é então interpretado como evidência a favor de B, porque controlamos o erro do tipo I; portanto, é improvável que not-B seja verdadeiro. Confuso ...?

Tomemos o exemplo de tratamento versus nenhum tratamento em dois grupos de uma população. A hipótese interessante é que o tratamento tem um efeito, ou seja, existe uma diferença entre o grupo tratado e o grupo não tratado devido ao tratamento. A hipótese nula é que não há diferença, e controlamos a probabilidade de rejeitar erroneamente essa hipótese. Assim, controlamos a probabilidade de concluir erroneamente que há um efeito de tratamento quando não há efeito de tratamento. O erro do tipo II é a probabilidade de aceitar incorretamente o nulo quando há um efeito de tratamento.

$\alpha$ a hipótese nula (em vez disso, aceitamos a hipótese nula). Portanto, devemos ter cuidado ao concluir que a hipótese nula é verdadeira apenas porque não podemos rejeitá-la.

$p$ $p$ $p$ $p$ $p$ -value não precisa ser justificado por um número (imaginário) repetido de decisões.

Nenhuma das estruturas está livre de problemas, e a terminologia é frequentemente confusa. Posso recomendar o livro Evidência estatística: um paradigma de probabilidade de Richard M. Royall para um tratamento claro dos diferentes conceitos.

NRH
fonte

5

A resposta "freqüentista" é inventar uma hipótese nula da forma "não B" e depois argumentar contra "não B", como na resposta de Steffen. Este é o equivalente lógico de se argumentar "Você está errado, portanto devo estar certo". Esse é o tipo de raciocínio usado pelo político (ou seja, o outro partido é ruim, portanto somos bons). É bastante difícil lidar com mais de uma alternativa nesse tipo de raciocínio. Isso ocorre porque o argumento "você está errado, logo estou certo" só faz sentido quando não é possível que ambos estejam errados, o que certamente pode acontecer quando há mais de uma hipótese alternativa.

A resposta "bayesiana" é simplesmente calcular a probabilidade da hipótese de que você está interessado em testar, dependendo de qualquer evidência que tenha. Sempre isso contém informações anteriores, que são simplesmente as suposições que você fez para tornar seu problema bem posicionado (todos os procedimentos estatísticos dependem de informações anteriores, os bayesianos apenas os tornam mais explícitos). Geralmente também consiste em alguns dados, e temos pelo teorema de bayes

P (H_{0} | D I) = \frac{P (H_{0} | I) P (D | H_{0} I)}{\sum_{k} P (H_{k} | I) P (D | H_{k} I)}

$P(H_{0}|DI)=\frac{P(H_{0}|I)P(D|H_{0}I)}{\sum_{k}P(H_{k}|I)P(D|H_{k}I)}$

$H_0$ $H_0$ é a "alternativa". São apenas as conotações implícitas pelas palavras "nulo" e "alternativa" que as fazem parecer diferentes. Você pode mostrar equivalência no caso do "Neyman Pearson Lemma" quando houver duas hipóteses, pois essa é simplesmente a razão de verossimilhança, que é dada de uma só vez, aproveitando as probabilidades do teorema de bayes acima:

\frac{P (H_{0} | D I)}{P (H_{1} | D I)} = \frac{P (H_{0} | I)}{P (H_{1} | I)} \times \frac{P (D | H_{0} I)}{P (D | H_{1} I)} = \frac{P (H_{0} | I)}{P (H_{1} | I)} \times Λ

$\frac{P(H_{0}|DI)}{P(H_{1}|DI)}=\frac{P(H_{0}|I)}{P(H_{1}|I)}\times\frac{P(D|H_{0}I)}{P(D|H_{1}I)}=\frac{P(H_{0}|I)}{P(H_{1}|I)}\times\Lambda$

$H_0$ $\Lambda > \tilde{\Lambda}$ $\tilde{\Lambda}$ $H_1$ $\frac{L_2}{L_1}$ $L_1$ $L_2$

$\Lambda^{-1}<\tilde{\Lambda}^{-1}$

probabilityislogic
fonte

3

Esse primeiro parágrafo é uma paródia da abordagem clássica ao teste de hipóteses.

whuber

O teste de hipóteses nem sempre é uma questão de tomar uma decisão. Muitas vezes, é formulado como tal, mas na ciência a questão pode ser documentar que o nulo é falso e por quanto. Eu vejo a palavra jogo como um lembrete deste objetivo. Desse ponto de vista, deixar de rejeitar não é uma decisão de aceitar, mas uma falta de evidência nos dados para rejeitar.

NRH 29/06

@ NRH - eu concordo, mas esse nem sempre é o objetivo. Se você deseja testar uma nova teoria, quer saber qual a probabilidade de ser verdade, da mesma forma que deseja saber a probabilidade de ela ser falsa. E embora um teste de hipótese nem sempre leve diretamente a uma decisão, parece um desperdício de tempo se preocupar em testá-lo se, eventualmente, não levar a uma decisão. Na verdade, você já está formulando uma decisão em seu comentário: "aja como se o nulo fosse falso". Existe apenas uma alternativa para isso: "aja como se o nulo fosse verdadeiro". Se houver mais de uma alternativa, então a hipótese ...

probabilityislogic

(continua) .. teste não foi bem definido e é "matematicamente mal colocado", por assim dizer. Pode haver uma grande incerteza sobre essa decisão, mas não há outras alternativas, o nulo não pode não ser verdadeiro nem falso ao mesmo tempo, a menos que você tenha um problema mal colocado / ambíguo. Mas, neste caso, o teste de hipóteses é inútil - não pode haver uma conclusão adequada.

probabilityislogic

(continuando o discurso retórico) - e se o objetivo é simplesmente quantificar a evidência contra o nulo, não é necessário um teste de hipótese. É para isso que serve o valor-p - você não precisa aceitar ou rejeitar, apenas relate seu valor.

probabilityislogic

1

A hipótese nula geralmente deve assumir que as diferenças em uma variável de resposta são devidas apenas a erros.

Ax $H_0$ Ax

Não rejeitar esta hipótese nula seria interpretado como:

1) quaisquer diferenças xsão devidas apenas a erros e não Aou,

2) que os dados são inadequados para detectar uma diferença mesmo que exista (consulte o erro Tipo 2 abaixo).

$H_a$ Ax

$H_0$ Ax $H_0$ Ax

DQdlM
fonte

1

O terceiro parágrafo parece sugerir que não rejeitar o nulo significa que o nulo é verdadeiro, mas claramente isso está errado: a alternativa pode ser verdadeira (e geralmente é), mas não difere suficientemente do nulo para ser detectada com os dados fornecidos.

whuber

@whuber - bom ponto, vou editar a resposta para refletir isso #

DQdlM

Como especificar a hipótese nula no teste de hipótese

Respostas: