Testando hipóteses. Por que centralizar a distribuição da amostra em H0?

9

Um valor-p é a probabilidade de obter uma estatística que seja pelo menos tão extrema quanto a observada nos dados da amostra ao assumir que a hipótese nula ( ) é verdadeira.H0

Graficamente, isso corresponde à área definida pela estatística da amostra sob a distribuição amostral que se obteria ao assumir :H0

center h0

No entanto, como a forma dessa distribuição assumida é realmente baseada nos dados da amostra, centralizá-la em parece uma escolha estranha para mim. Se alguém usasse a distribuição amostral da estatística, ou seja, centralize a distribuição na estatística da amostra, o teste de hipóteses corresponderia à estimativa da probabilidade de dadas as amostras.μ 0μ0
μ0

centro h1

Nesse caso, o valor p é a probabilidade de obter uma estatística pelo menos tão extrema quanto dados os dados em vez da definição acima.μ0

Além disso, essa interpretação tem a vantagem de se relacionar bem com o conceito de intervalos de confiança:
um teste de hipótese com nível de significância seria equivalente a verificar se enquadra no intervalo de confiança da distribuição da amostra.μ 0 ( 1 - α )αμ0(1α)

CI2 95

Portanto, sinto que centralizar a distribuição em pode ser uma complicação desnecessária. Existem justificativas importantes para esta etapa que eu não considerei?μ0

matti
fonte
2
Por favor, diga-nos qual será a distribuição de amostragem se você não assumir . (Resposta: você não pode, exceto nos exemplos de livros didáticos em que a hipótese alternativa especifica uma distribuição exclusiva.)H0
whuber
Não tenho certeza se entendi a solicitação corretamente, mas no exemplo acima, seria a distribuição amostral da média. Agora adicionei uma figura à pergunta que mostra essa distribuição, juntamente com um intervalo / área de confiança de 95%, que também deve ajudar a ilustrar a relação com os intervalos de confiança.
Matti
2
Você não tem como saber a distribuição amostral da média. Para saber isso, você precisa saber o verdadeiro significado: mas essa é precisamente a quantidade que você está tentando testar! Sua lógica é completamente circular.
whuber
1
Eu entendi que esse era o seu significado. Em geral, até que você conheça - ou assuma - os verdadeiros parâmetros da distribuição, não poderá conhecer a distribuição de nenhuma propriedade da amostra. (Na verdade, se você pode deduzir a distribuição de quaisquer bens amostra sem assumir conhecimento dos parâmetros, isso seria prova de que ele não lhe dá nenhuma informação sobre os parâmetros!)
whuber
1
Não posso, porque parece que você não está usando termos como "médio", "estimado" ou mesmo "H0" em seus sentidos estatísticos usuais. Estou completamente perdido para entender qual é a sua pergunta. A única coisa que fica clara é que se baseia em um mal-entendido de teste de hipótese nula, mas suas respostas aos meus comentários não forneceram nenhuma indicação útil sobre o que esse mal-entendido pode ser.
whuber

Respostas:

5

Suponha que é uma amostra retirada de uma distribuição normal com média desconhecida e variação conhecida . A média da amostra é, portanto, normal com média e variância . Sobre isso, acho que não há possibilidade de discordância.X=(X1,X2,,Xn)μσ2X¯μσ2/n

Agora, você propõe que nossa estatística de teste seja Direita? Mas isso não é estatístico . Por quê? Porque é um parâmetro desconhecido . Uma estatística é uma função da amostra que não depende de nenhum parâmetro desconhecido. Portanto, uma suposição deve ser feita sobre para que seja uma estatística. Uma dessas suposições é escrever sob o qual que é uma estatística.

Z=X¯μσ/nNormal(0,1).
μμZ
H0:μ=μ0,vs.H1:μμ0,
ZH0=X¯μ0σ/nNormal(0,1),

Por outro lado, você propõe usar si. Nesse caso, identicamente, e nem é uma variável aleatória, muito menos distribuída normalmente. Não há nada para testar.μ=X¯Z=0

heropup
fonte
1
Obrigado. Isso é muito direto e agora eu realmente me pergunto como eu poderia ter perdido isso antes. Tudo o que restaria agora como desculpa para o segundo caso apresentado é confiar no cálculo do intervalo de confiança. No entanto, como a margem de erro é explicitamente adicionada / subtraída da estimativa de média ou ponto, o uso dessa estimativa se torna uma etapa que precisaria ser justificada.
matti
12

No entanto, como o formato dessa distribuição assumida é realmente baseado nos dados da amostra, centralizá-lo em H0 parece uma escolha estranha para mim.

Na verdade, isso não é verdade. A forma dessa distribuição assumida vem da aceitação de como verdadeira.H0A amostra não está diretamente envolvida nisso, exceto por algumas suposições.Usar a amostra diretamente, não é suficiente. Você também precisa da hipótese nula para manter.

Se alguém usasse a distribuição amostral da estatística, ou seja, centralize a distribuição na estatística da amostra, o teste de hipótese corresponderia à estimativa da probabilidade de H0, dadas as amostras.

A questão é: como você estima uma probabilidade de algo que você supõe ser verdadeiro. No nosso caso, se você considerar como verdadeiro, é inútil tentar estimar a probabilidade de ser verdadeiro.H0H0

Portanto, sinto que centralizar a distribuição em H0 é uma complicação desnecessária.

Você não tem duas distribuições lá, existe apenas uma, a que se supõe ser a sua verdade básica, também conhecida como a que vem com . No entanto, existe uma distribuição de amostragem derivada da amostra, mas isso não está envolvido nas hipóteses que você usa.H0

Um bom exercício seria tentar replicar a mesma lógica com uma distribuição assimétrica. Faça a distribuição do qui-quadrado como no teste de independência do qui-quadrado. Você é capaz de reproduzi-lo? Eu acho que a resposta é não.

rapaio
fonte
" Na verdade, isso não é verdade. O formato dessa distribuição assumida vem da aceitação de H0 como verdadeira. A amostra não está diretamente envolvida nisso, exceto por algumas suposições. " Mas, no caso do teste t de uma amostra apresentado acima, o a estatística de teste inclui o SEM e a média da amostra e, portanto, depende dos dados da amostra. Além disso, os graus de liberdade que determinam a altura das caudas dependem do tamanho da amostra.
t=x¯μ0sn
matti
1
Minha formulação foi enganosa. Eu estava tentando dizer que você pode usar qualquer informação que você tenha, também a própria amostra, mas não é suficiente. Para avaliar os valores de p e ter uma distribuição, é necessário assumir também a hipótese nula. Eu reformulo no post também.
rapaio 24/06
1
... Tome por exemplo a sua fórmula de , ele usa que eu suponho que o valor da hipótese nulatμ0H0:μ=μ0
rapaio
2

Pelo que entendi, você está argumentando que faz mais sentido 'inverter' e .H0H1

Acho útil pensar no teste de hipóteses como uma prova por contradição. Assumimos que é verdadeiro e mostramos que as evidências indicam que essa suposição é falha, justificando assim a rejeição de em favor de .H0H0H1

Isso funciona porque quando assumimos e centralizamos nossa distribuição lá, podemos determinar quão provável / improvável é nossa observação. Por exemplo, se vs. e determinamos a partir de nossos testes que há menos de 5% de chance de que a verdadeira média realmente seja igual a 0, podemos rejeitar com 95 % de confiança.H0H0:μ=0H1:μ0μH0

O contrário não é necessariamente verdadeiro. Digamos que façamos um experimento e determinemos que na verdade existe uma chance de 30% de que a hipótese nula ainda seja válida. Não podemos rejeitar o nulo, mas também não o aceitamos . Essa situação não mostra que (o nulo) é verdadeiro, mas que não temos evidências para mostrar que é falso.H0

Agora imagine se revirássemos essa situação. Digamos que e descubra que, considerando nossos resultados, a probabilidade de é de 5% ou menos, o que isso significa? Claro que podemos rejeitar o nulo, podemos necessariamente aceitar ? É difícil justificar aceitar a coisa que assumimos como verdadeira no começo.H1H0H1

Mostrar que é falso não é o resultado que buscamos; queremos argumentar a favor do . Ao fazer o teste da maneira que você descreve, estamos mostrando que não temos evidências para dizer que é falso, o que é sutilmente diferente de argumentar que é verdadeiro.H0H1H1H1

Bryan Goggin
fonte
Como o teste de hipóteses não nos permite eliminar completamente a incerteza, não a consideraria uma prova . Talvez eu não tenha esclarecido meu argumento o suficiente, mas estou essencialmente pedindo uma razão lógica e não semântica para mudar a distribuição de amostragem para . H0
matti
E, em geral, o H1 é bastante vago (mu! = 0), tornando os cálculos de probabilidade problemáticos. Embora eu suponha que isso geralmente seja um bom incentivo para as pessoas ficarem bayesianas. :)
Hao Ye