Deixando de lado algumas questões práticas (como a extensão em que é arbitrário, por exemplo), as definições de nível de significância e valor-p tornam a resposta a essa pergunta inequívoca.α
Ou seja, formalmente, a regra de rejeição é que você rejeita quando .p=α
Realmente deve importar apenas para o caso discreto, mas nessa situação, se você não rejeitar quando , sua taxa de erro do tipo I não será realmente α !p = αα
(No que me diz respeito, não há citação 'autoritária'; você realmente precisa entender as abordagens de Neyman-Pearson e dos Pescadores dos testes de hipóteses, e é algo que se desenvolveu ao longo do tempo.)
Há vários textos estatísticos bons que descrevem o teste de hipóteses corretamente.
A definição do valor-p é dada corretamente na primeira frase do artigo relevante da Wikipedia *:
o valor p é a probabilidade de obter uma estatística de teste pelo menos tão extrema quanto a que foi realmente observada, assumindo que a hipótese nula seja verdadeira.
* (e não, a Wikipedia não é uma autoridade, estou apenas dizendo que a definição está correta)
Para simplificar, vamos ficar com pontos nulos; serve para transmitir o ponto sem atrapalhar as águas com outros problemas.
Agora, o nível de significância, αp α
** Bem, acho que estou limitando minha discussão a apenas estatísticas de teste distribuídas de maneira puramente discreta ou puramente contínua. No caso misto, você pode descobrir como a minha discussão discreta se aplica (nas situações em que se aplica).
n=17α=4.904%137500217
H0p=αα
H0p=αα
p=α
[Agora, vamos considerar sua situação. É o seu valor pp=α
Se você descrever sua regra de rejeição com antecedência e mostrar que (se as suposições forem atendidas), ela tiver o nível de significância desejado, provavelmente não haverá necessidade de referências.
Uma regra de rejeição é simplesmente uma declaração sobre quais valores da estatística de teste farão com que você rejeite H0
α
(Se você tiver uma edição diferente, os números das páginas podem mudar, mas ele possui um índice, para que você possa procurar termos; tenha cuidado, talvez seja necessário consultar as listagens em 'Teste de hipóteses' ou algo semelhante no índice para encontrar 'região de rejeição')
Hmm, vamos tentar outro livro da prateleira. Wackerly, Mendenhall e Scheaffer Mathematics Statistics with Applications, 5ª edição , define uma região de rejeição na p412 e um valor-p (a mesma definição de C&B) na p431.
Uma confissão interessante que eu aprendi na aula de bioestatística de um professor é que o nível de significância de 0,05 foi mais alcançado por um consenso do que por uma verdade de ouro. Desde então, tenho visto literatura que flerta com o nível de significância de 0,05, como "aproximar-se" de ainda ser uma descoberta impressionante do estudo e ouvi argumentos de que o nível de significância de 0,05 pode não se aplicar a todos os campos de pesquisa. Com isso dito, achei estimativas pontuais e intervalos de confiança mais informativos que os níveis de significância. Aqui está um artigo interessante sobre o assunto (para mim de qualquer maneira).
fonte
O valor de p é geralmente definido para consenso como dito anteriormente (ou melhor, preguiça). Para realmente poder dizer que algo é significativo, precisamos encontrar o valor de p que corresponde ao tamanho do efeito, tamanho da amostra e quão rigoroso você deseja que seja para seus dados. Isso é chamado de análise de energia (é um subcampo dentro das estatísticas). Muitas pessoas não estão cientes ou simplesmente não o usam porque não é simples. Isso não quer dizer que está tudo bem do jeito que está. Devemos sempre fazer esse tipo de estudo para extrair inferências realmente significativas.
fonte