Um valor-p é a probabilidade de obter uma estatística que seja pelo menos tão extrema quanto a observada nos dados da amostra ao assumir que a hipótese nula ( ) é verdadeira.
Graficamente, isso corresponde à área definida pela estatística da amostra sob a distribuição amostral que se obteria ao assumir :
No entanto, como a forma dessa distribuição assumida é realmente baseada nos dados da amostra, centralizá-la em parece uma escolha estranha para mim.
Se alguém usasse a distribuição amostral da estatística, ou seja, centralize a distribuição na estatística da amostra, o teste de hipóteses corresponderia à estimativa da probabilidade de dadas as amostras.μ 0
Nesse caso, o valor p é a probabilidade de obter uma estatística pelo menos tão extrema quanto dados os dados em vez da definição acima.
Além disso, essa interpretação tem a vantagem de se relacionar bem com o conceito de intervalos de confiança:
um teste de hipótese com nível de significância seria equivalente a verificar se enquadra no intervalo de confiança da distribuição da amostra.μ 0 ( 1 - α )
Portanto, sinto que centralizar a distribuição em pode ser uma complicação desnecessária.
Existem justificativas importantes para esta etapa que eu não considerei?
Respostas:
Suponha que é uma amostra retirada de uma distribuição normal com média desconhecida e variação conhecida . A média da amostra é, portanto, normal com média e variância . Sobre isso, acho que não há possibilidade de discordância.X=(X1,X2,…,Xn) μ σ2 X¯ μ σ2/n
Agora, você propõe que nossa estatística de teste seja Direita? Mas isso não é estatístico . Por quê? Porque é um parâmetro desconhecido . Uma estatística é uma função da amostra que não depende de nenhum parâmetro desconhecido. Portanto, uma suposição deve ser feita sobre para que seja uma estatística. Uma dessas suposições é escrever sob o qual que é uma estatística.
Por outro lado, você propõe usar si. Nesse caso, identicamente, e nem é uma variável aleatória, muito menos distribuída normalmente. Não há nada para testar.μ=X¯ Z=0
fonte
Na verdade, isso não é verdade. A forma dessa distribuição assumida vem da aceitação de como verdadeira.H0
A amostra não está diretamente envolvida nisso, exceto por algumas suposições.Usar a amostra diretamente, não é suficiente. Você também precisa da hipótese nula para manter.A questão é: como você estima uma probabilidade de algo que você supõe ser verdadeiro. No nosso caso, se você considerar como verdadeiro, é inútil tentar estimar a probabilidade de ser verdadeiro.H0 H0
Você não tem duas distribuições lá, existe apenas uma, a que se supõe ser a sua verdade básica, também conhecida como a que vem com . No entanto, existe uma distribuição de amostragem derivada da amostra, mas isso não está envolvido nas hipóteses que você usa.H0
Um bom exercício seria tentar replicar a mesma lógica com uma distribuição assimétrica. Faça a distribuição do qui-quadrado como no teste de independência do qui-quadrado. Você é capaz de reproduzi-lo? Eu acho que a resposta é não.
fonte
Pelo que entendi, você está argumentando que faz mais sentido 'inverter' e .H0 H1
Acho útil pensar no teste de hipóteses como uma prova por contradição. Assumimos que é verdadeiro e mostramos que as evidências indicam que essa suposição é falha, justificando assim a rejeição de em favor de .H0 H0 H1
Isso funciona porque quando assumimos e centralizamos nossa distribuição lá, podemos determinar quão provável / improvável é nossa observação. Por exemplo, se vs. e determinamos a partir de nossos testes que há menos de 5% de chance de que a verdadeira média realmente seja igual a 0, podemos rejeitar com 95 % de confiança.H0 H0:μ=0 H1:μ≠0 μ H0
O contrário não é necessariamente verdadeiro. Digamos que façamos um experimento e determinemos que na verdade existe uma chance de 30% de que a hipótese nula ainda seja válida. Não podemos rejeitar o nulo, mas também não o aceitamos . Essa situação não mostra que (o nulo) é verdadeiro, mas que não temos evidências para mostrar que é falso.H0
Agora imagine se revirássemos essa situação. Digamos que e descubra que, considerando nossos resultados, a probabilidade de é de 5% ou menos, o que isso significa? Claro que podemos rejeitar o nulo, podemos necessariamente aceitar ? É difícil justificar aceitar a coisa que assumimos como verdadeira no começo.H1 H0 H1
Mostrar que é falso não é o resultado que buscamos; queremos argumentar a favor do . Ao fazer o teste da maneira que você descreve, estamos mostrando que não temos evidências para dizer que é falso, o que é sutilmente diferente de argumentar que é verdadeiro.H0 H1 H1 H1
fonte