fundo
Em ciência da computação, matemática e, às vezes, em outros campos, exemplos "esotéricos" não podem ser apenas divertidos, mas úteis para ilustrar certos conceitos, por exemplo:
Bogosort e Slowsort são algoritmos de classificação muito ineficientes que podem ser usados para entender as propriedades dos algoritmos, principalmente quando comparados a outros algoritmos de classificação.
As linguagens de programação esotéricas demonstram o alcance do conceito de linguagem de programação e ajudam a apreciar boas linguagens de programação.
A função Weierstraß e a função Dirichlet encontram principalmente utilidade para ilustrar certos conceitos errados sobre o conceito de continuidade.
Atualmente, estou preparando alguns ensinamentos sobre o uso de testes de hipóteses e acho que ter um teste com potência muito baixa (mas sem outras falhas) ajudaria a ilustrar o conceito de poder estatístico. (É claro, ainda tenho que decidir se um determinado exemplo é didaticamente útil para o meu público ou apenas confuso.)
Pergunta real
Existe algum teste estatístico com potência intencionalmente baixa, mais especificamente:
- O teste se encaixa na estrutura geral dos testes de hipóteses, ou seja, trabalha com uma hipótese nula, possui requisitos e retorna um valor p (correto) .
- Não se destina / propõe a aplicação séria.
- Ele tem uma potência muito baixa (devido a uma falha de projeto intencional e não devido ao baixo tamanho da amostra ou do efeito).
Se você puder argumentar fundamentalmente que esse teste não pode existir, eu também consideraria uma resposta válida para minha pergunta. Se, por outro lado, existe uma infinidade de testes, estou interessado no mais didaticamente eficiente, ou seja, deve ser facilmente acessível e ter um efeito marcante.
Observe que não estou pedindo uma seleção geral de erros estatísticos (escolha de cereja, etc.) ou similar.
O que eu encontrei até agora
As pesquisas na Internet não retornaram nada para mim.
Toda tentativa de construir algo assim acabou em algum teste (útil) existente ou o formato não é o de um teste regular. Por exemplo, pensei em testar se uma população tem uma mediana positiva que retorna apenas sim se todas as amostras forem positivas; mas esse teste não retorna um valor p e, portanto, não se encaixa na estrutura de teste usual. Se eu apenas contar os sinais positivos e negativos como uma estatística de teste (e calcular os valores de p de acordo), terminarei com o teste de sinais , que é um teste razoável.
fonte
Respostas:
Há um corolário pouco comentado no lema Neyman – Pearson (prova em Geisser (2006), Modos de Inferência Estatística Paramétrica , Cap. 4.4):Eϕ(X)=α
ϕ(x)={0 1 when f0(x)<kf1(x)when f0(x)>kf1(x)
define onívelmenospoderoso-α teste, ϕ , da hipótese nula H 0 :α ϕ H0: densidade f0 vs H1: densidade f1 dos dados x .
A partir desse resultado, você pode obter testes uniformemente menos poderosos, localmente menos poderosos, uniformemente menos poderosos semelhantes e menos poderosos "totalmente tendenciosos" (quero dizer aqueles com menor poder sob qualquer alternativa que sob o nulo). Se você já tem um uniforme mais poderoso, & c. teste, simplesmente multiplique sua estatística de teste por -1 para manter o particionamento do espaço de amostra que ele induz ao reverter a ordem das partições.
Talvez, como sugere @ user54038, "a falha de um método geral de construção de teste" possa ser mais interessante. Lehmann (1950), "Alguns princípios da teoria de testar hipóteses estatísticas", Ann. Matemática. Statist. , 21 , 1, atribui o seguinte exemplo a Stein:
fonte
(Relacionado ao comentário por @Scortchi)
Por construção, este é um teste de tamanho válidoα
fonte