quais são as premissas do teste de permutação?

22

É frequentemente afirmado que os testes de permutação não têm suposições, mas isso certamente não é verdade. Por exemplo, se minhas amostras estão de alguma forma correlacionadas, posso imaginar que permutar seus rótulos não seria a coisa correta a fazer. Só acho que encontrei sobre esse problema esta frase da wikipedia: "Uma suposição importante por trás de um teste de permutação é que as observações são permutáveis ​​sob a hipótese nula". O que eu não entendo.

Quais são as premissas dos testes de permutação? E como essas suposições estão ligadas a diferentes esquemas de permutação possíveis?

rep_ho
fonte
4
(+1) A citação da Wikipedia, embora correta, é meio engraçada, porque quando você passa pelo jargão técnico (obscurecedor), tudo se resume a dizer que você deve permutar exatamente as observações que supõe que pode permutar.
whuber
1
Difícil de responder, pois existem muitos testes de permutação diferentes. Por exemplo, para uma comparação de amostras k, a heterocedasticidade entre os grupos violaria a hipótese de permutabilidade.
Michael M
1
(+1) Com base em Rubin (2015) "Inferência Causal para Estatística", quando o rótulo (ou tratamento) é independente dos resultados potenciais, você pode usar o teste de permutação. A lógica é para cada sujeito, e tem dois resultados possíveis sob os rótulos A e B, eles são fixos. O procedimento de atribuição de rótulo é aleatório e, se for independente do resultado potencial, você pode pensar em executar esse procedimento de atribuição de rótulo N vezes, N é o número total de permutações dos rótulos e obter uma distribuição da estatística que deseja. se importar. Então você verificar quantil da quantidade observada
KevinKim

Respostas:

17

A literatura distingue dois tipos de testes de permutações: (1) o teste de randomização é o teste de permutação em que a permutabilidade é satisfeita pela atribuição aleatória de unidades experimentais às condições; (2) o teste de permutação é exatamente o mesmo teste, mas aplicado a uma situação em que outras premissas (ou seja, que não sejam atribuição aleatória) são necessárias para justificar a permutabilidade.

Algumas referências sobre as convenções de nomenclatura (ou seja, randomização versus permutação): Kempthorne & Doerfler, Biometrika, 1969; Edgington & Onghena, Randomization Tests, 4ª Ed., 2007

Para suposições, o teste de randomização (isto é, o teste de Fisher para dados experimentais) requer apenas o que Donald Rubin se refere como a suposição de valor de tratamento unitário estável (SUTVA). Veja o comentário de Rubin em 1980 sobre o artigo de Basu na JASA. O SUTVA também é uma das premissas fundamentais (juntamente com forte ignorabilidade) para a inferência causal sob o modelo de resultados potenciais de Neyman-Rubin (cf. artigo JASA de Paul Holland, 1986). Essencialmente, o SUTVA diz que não há interferência entre as unidades e que as condições de tratamento são as mesmas para todos os receptores. Mais formalmente, o SUTVA assume independência entre os resultados potenciais e o mecanismo de atribuição.

Considere o problema de duas amostras com os participantes aleatoriamente designados para um grupo controle ou um grupo de tratamento. O SUTVA seria violado se, por exemplo, dois participantes do estudo estivessem familiarizados e o status de atribuição de um deles exercesse alguma influência no resultado do outro. É isso que significa não haver interferência entre as unidades.

A discussão acima se aplica ao teste de randomização em que os participantes foram designados aleatoriamente para grupos. No contexto de um teste de permutação, o SUTVA também é necessário, mas pode não se basear na randomização porque não houve.

Na ausência de atribuição aleatória, a validade dos testes de permutação pode depender de premissas distributivas como forma idêntica de distribuição ou distribuições simétricas (dependendo do teste) para satisfazer a permutabilidade (ver Box e Anderson, JRSSB, 1955).

Em um artigo interessante, Hayes, Psych Methods, 1996, mostra através de simulação como as taxas de erro do tipo I podem aumentar se os testes de permutação forem usados ​​com dados não randomizados.

bsbk
fonte
-5

Consulte "Um iniciador sobre análise de dados quantizados e testes de permutação" (página 88).

Davester
fonte
1
(-) Dar uma citação não é uma resposta. Primeiro de tudo, alguém não poderia ter o livro que você citou. Segundo, você nem fornece uma referência válida, para que possamos apenas adivinhar o que você cita!
Tim
1
Eu procurei aquele papel (é de acesso livre, btw: obrigado!). No entanto, ele não responde à pergunta. Tudo isso mostra relevância na p. 88 é "O teste de permutação não se baseia em suposições tradicionais de distribuição; em vez disso, depende do modelo de randomização de RA Fisher (1935/1990)". Agradeceríamos se você se sentisse inclinado a elaborar isso em uma resposta expandida.
whuber
O artigo fornece referências onde você pode encontrar suposições para testes de permutação. Desculpe, mas não tenho tempo para procurar a pessoa que fez a pergunta.
Davester
1
Então você realmente não respondeu à pergunta.
Neuronet