Eu continuo vendo essa famosa citação em todos os lugares, mas não consigo entender a parte enfatizada todas as vezes.
Um homem que 'rejeita' provisoriamente uma hipótese, como uma questão de prática habitual, quando a significância está no nível de 1% ou mais, certamente estará enganado em não mais de 1% de tais decisões. Pois quando a hipótese estiver correta, ele estará errado em apenas 1% desses casos, e quando estiver incorreto, ele nunca estará errado em rejeitar. [...] No entanto, o cálculo é absurdamente acadêmico, pois, de fato, nenhum cientista tem um nível fixo de significância, no qual, ano a ano, e em todas as circunstâncias, ele rejeita hipóteses; ele prefere dedicar sua mente a cada caso particular à luz de suas evidências e idéias.Não se deve esquecer que os casos escolhidos para a aplicação de um teste são manifestamente um conjunto altamente selecionado e que as condições de seleção não podem ser especificadas nem para um único trabalhador; nem que, no argumento usado, seria claramente ilegítimo escolher o nível real de significância indicado por um teste em particular, como se fosse seu hábito ao longo da vida usar exatamente esse nível.
(Métodos estatísticos e inferência científica, 1956, p. 42-45)
Mais especificamente, eu não entendo
- Por que os casos escolhidos para a aplicação de um teste são "altamente selecionados"? Diga que você se pergunta se a altura média das pessoas dentro de uma área é inferior a 165 cm e decide realizar um teste. O procedimento padrão, tanto quanto eu sei, é coletar amostras aleatórias da área e medir sua altura. Como isso pode ser altamente selecionado?
- Suponha que os casos sejam altamente selecionados, mas como isso está relacionado à escolha do nível de significância? Considere novamente o exemplo acima, se o seu método de amostragem (suponho que Fisher se refere como condições de seleção ) for distorcido e de alguma forma favorecer as pessoas altas, toda a pesquisa será arruinada e a determinação subjetiva do nível de significância não poderá salvá-lo.
Tentando ver o plano de fundo da citação, cheguei a uma versão do livro (não sei qual é a versão) que possui uma citação ligeiramente diferente
https://archive.org/details/in.ernet.dli.2015.134555/page/n47
Isso me parece uma crítica ao usar a expressão matemática de possibilidades de rejeição, erros do tipo I, como argumento rigoroso. Essas expressões geralmente não são uma boa expressão para o que é relevante e nem são rigorosas.
Por que os casos escolhidos para a aplicação de um teste são "altamente selecionados"?
Isso parece estar relacionado à frase
Não somos indiferentes à hipótese que está sendo testada, e muitas vezes não se acredita que uma hipótese que está sendo testada seja verdadeira.
como isso está relacionado à escolha do nível de significância?
Isso se refere a
O valor p é apenas a frequência de cometer um erro quando a hipótese nula é verdadeira. Mas a frequência real de cometer um erro será diferente (menor).
o que é "o nível real de significância indicado por um estudo específico" referente a
Acredito que esta parte se refira a algum tipo de invasão de valor p. Alterando o nível de significância, alfa, depois que as observações ocorrerem para corresponder ao valor p observado, e finja que esse foi o valor de corte desde o início.
fonte