Existem testes estatísticos "esotéricos" com potência muito baixa?

11

fundo

Em ciência da computação, matemática e, às vezes, em outros campos, exemplos "esotéricos" não podem ser apenas divertidos, mas úteis para ilustrar certos conceitos, por exemplo:

  • Bogosort e Slowsort são algoritmos de classificação muito ineficientes que podem ser usados ​​para entender as propriedades dos algoritmos, principalmente quando comparados a outros algoritmos de classificação.

  • As linguagens de programação esotéricas demonstram o alcance do conceito de linguagem de programação e ajudam a apreciar boas linguagens de programação.

  • A função Weierstraß e a função Dirichlet encontram principalmente utilidade para ilustrar certos conceitos errados sobre o conceito de continuidade.

Atualmente, estou preparando alguns ensinamentos sobre o uso de testes de hipóteses e acho que ter um teste com potência muito baixa (mas sem outras falhas) ajudaria a ilustrar o conceito de poder estatístico. (É claro, ainda tenho que decidir se um determinado exemplo é didaticamente útil para o meu público ou apenas confuso.)

Pergunta real

Existe algum teste estatístico com potência intencionalmente baixa, mais especificamente:

  • O teste se encaixa na estrutura geral dos testes de hipóteses, ou seja, trabalha com uma hipótese nula, possui requisitos e retorna um  valor p (correto) .
  • Não se destina / propõe a aplicação séria.
  • Ele tem uma potência muito baixa (devido a uma falha de projeto intencional e não devido ao baixo tamanho da amostra ou do efeito).

Se você puder argumentar fundamentalmente que esse teste não pode existir, eu também consideraria uma resposta válida para minha pergunta. Se, por outro lado, existe uma infinidade de testes, estou interessado no mais didaticamente eficiente, ou seja, deve ser facilmente acessível e ter um efeito marcante.

Observe que não estou pedindo uma seleção geral de erros estatísticos (escolha de cereja, etc.) ou similar.

O que eu encontrei até agora

As pesquisas na Internet não retornaram nada para mim.

Toda tentativa de construir algo assim acabou em algum teste (útil) existente ou o formato não é o de um teste regular. Por exemplo, pensei em testar se uma população tem uma mediana positiva que retorna apenas sim se todas as amostras forem positivas; mas esse teste não retorna um  valor p e, portanto, não se encaixa na estrutura de teste usual. Se eu apenas contar os sinais positivos e negativos como uma estatística de teste (e calcular os  valores de p de acordo), terminarei com o teste de sinais , que é um teste razoável.

Wrzlprmft
fonte
2
Sendo mais matemáticos, os exemplos "esotéricos" (que abundam) tendem a ser contra-exemplos específicos para mal-entendidos populares; vários livros didáticos contêm esses exemplos. Tal como está, sua pergunta é essencialmente uma questão do tipo "grande lista" e, portanto, é muito ampla (embora você deva observar que vários usuários concluíram que a pergunta não é clara); se você pode esclarecer sua pergunta e restringir seu escopo, ela pode se encaixar melhor no site.
Glen_b -instala Monica
1
Baixa potência em comparação com o que? Lehmann deu um exemplo de um teste de razão de verossimilhança generalizada que possuía menor poder sob qualquer hipótese alternativa do que sob o nulo.
Scortchi - Restabelece Monica
2
Qualquer um dos estimadores tolos aos quais você aplica Rao-Blackwellization pode ser usado como uma estatística de teste. Por exemplo, há a primeira observação na amostra, usada como um estimador da média. Quando Rao-Blackwellized, você obtém a média da amostra. Eu tive que fazer muitos exercícios como esse em sala de aula. De qualquer forma, essa estatística poderia ser usada em vez da média da amostra em algo como um teste . Mas não, não consigo pensar em nada diretamente no formulário que você procura, ou estaria escrevendo uma resposta, não um comentário. Mas deve haver algo que ilustra a falha de um método geral para a construção de testes. t
user54038
1
Vou cavar o jornal de Lehmann quando estiver no computador. O poder de um teste sob o nulo é apenas o tamanho do teste.
Scortchi - Restabelecer Monica
3
Um exemplo de teste usado em uma classe em que eu era aluno (muitos anos atrás) era "rolar um dado justo de 20 lados e rejeitar se você rolar um 1" (como parte de uma discussão sobre curvas de poder). É claro que isso ignora completamente os dados, mas é um teste "válido", pois ele não possui uma taxa de erro tipo I mais alta (que era de 5% no contexto em que o exemplo foi fornecido).
Glen_b -Reinstala Monica

Respostas:

7

Há um corolário pouco comentado no lema Neyman – Pearson (prova em Geisser (2006), Modos de Inferência Estatística Paramétrica , Cap. 4.4):

Eϕ(X)=α
ϕ(x)={0 when f0(x)<kf1(x)1 when f0(x)>kf1(x)
define onívelmenospoderoso-α teste, ϕ , da hipótese nula H 0 :αϕH0: densidade f0 vs H1: densidade f1 dos dados x .

A partir desse resultado, você pode obter testes uniformemente menos poderosos, localmente menos poderosos, uniformemente menos poderosos semelhantes e menos poderosos "totalmente tendenciosos" (quero dizer aqueles com menor poder sob qualquer alternativa que sob o nulo). Se você já tem um uniforme mais poderoso, & c. teste, simplesmente multiplique sua estatística de teste por -1 para manter o particionamento do espaço de amostra que ele induz ao reverter a ordem das partições.


Talvez, como sugere @ user54038, "a falha de um método geral de construção de teste" possa ser mais interessante. Lehmann (1950), "Alguns princípios da teoria de testar hipóteses estatísticas", Ann. Matemática. Statist. , 21 , 1, atribui o seguinte exemplo a Stein:

X0,±1,±2

22110Hypothesis H:α2α212α12ααAlternatives:pC(1p)C1C1α(12α)1C1α(12α)α1c1α
Aqui,αC0<α12α2α<C<αp[0,1]

HαX=±2CC<ααX

pX=2X=2p^=1p^=02CαX1C1α

Scortchi
fonte
5

(Relacionado ao comentário por @Scortchi)

XN(μ,1)

H0:μ=0H1:μ0

ZBernoulli(p)pαp[α,1]

R={(X,Z) | z=1 |x|>Φ1(α2p)}

Por construção, este é um teste de tamanho válido α

P(XR | μ=0)=P(Z=1 , |X|>Φ1(α2p))=P(Z=1)P(|X|>Φ1(α2p))=pαp=α

p(x,z)=(1000000,0)p=αXα

Z

knrumsey
fonte
2
SZ=1(S<FS1(p))FS()S