Testes de permutação: critérios para escolher uma estatística de teste

9

Uso regularmente testes de permutação e adoro a simplicidade deles. Aprendi mais com o livro "Métodos de reamostragem" de Good, no qual o autor parece bastante criativo em sua escolha de estatísticas de teste nos exemplos. Além disso, este post dá a impressão de que há uma grande liberdade para escolher uma estatística de teste.

Eu me pergunto se existem requisitos teóricos que uma estatística de teste deve cumprir . Ou podemos simplesmente usar qualquer estatística, desde que intuitivamente faça sentido e tenha boas taxas de erro Tipo I / II?

Por exemplo, quando um teste de permutação é usado em vez do teste t por causa de populações não normais, eu já vi várias vezes que o valor p do teste de permutação ainda é obtido nas estatísticas t. Embora não seja necessariamente errado, parece uma escolha estranha, dada a origem da distribuição t de Student.

lgbi
fonte

Respostas:

8

A estatística t faz muito sentido como estatística de teste; muitas pessoas acham isso intuitivo. Se eu citar uma estatística t de 0,5 ou 5,5, ela diz uma coisa - quantos erros padrão estão os meios.

A dificuldade - pelo menos com uma não normalidade moderada - não é tanto o uso da estatística quanto o uso da distribuição t para sua distribuição abaixo do nulo. A estatística é bastante sensata.

Obviamente, se você espera caudas substancialmente mais pesadas que o normal, uma estatística mais robusta faria melhor, mas a estatística t não é altamente sensível a desvios leves da normalidade (por exemplo, é menos sensível que a estatística da razão de variância).

Se você deseja usar apenas o numerador da estatística, isso é ótimo, faz todo o sentido como estatística de permutação, se você estiver interessado em uma diferença de médias. Se você estiver interessado em um senso mais geral de mudança de local, isso abrirá uma infinidade de outras possibilidades.

Você está certo ao pensar que há muita liberdade para escolher uma estatística e adaptá-la às circunstâncias específicas - em quais alternativas você deseja poder ou quais possíveis problemas você gostaria de ser robusto (a contaminação, por exemplo, pode poder de impacto).

Realmente quase não há restrições - você pode escolher quase qualquer coisa, incluindo estatísticas de teste inúteis. Há algumas considerações em que você realmente deve pensar ao escolher testes, é claro, mas você é livre para não fazê-lo.

-

Dito isto, existem alguns critérios que podem ser aplicados em várias circunstâncias.

Por exemplo, se você estiver particularmente interessado em um tipo específico de hipótese, poderá usar uma estatística que a reflita - por exemplo, se quiser testar uma diferença na média da população, geralmente faz sentido fazer sua estatística de teste relacionado a uma diferença nas médias da amostra.

Se você souber alguma coisa sobre o tipo de distribuição que possa ter - caudas pesadas, inclinações ou cauda nocional, mas com algum grau de contaminação, ou bimodal, ... poderá criar uma estatística de teste que possa se sair bem nessas circunstâncias, por exemplo, escolhendo uma estatística que tenha bom desempenho na situação prevista, mas que tenha alguma robustez à contaminação.

-

A simulação é uma maneira de investigar o poder em várias situações.

Glen_b -Reinstate Monica
fonte