Qual é a intuição por trás de amostras intercambiáveis ​​sob a hipótese nula?

15

Os testes de permutação (também chamados de teste de randomização, teste de re-randomização ou teste exato) são muito úteis e úteis quando a suposição de distribuição normal exigida por, por exemplo, t-testnão é atendida e quando a transformação dos valores pela classificação do teste não-paramétrico como Mann-Whitney-U-testlevaria a mais informações a serem perdidas. No entanto, uma e apenas uma suposição não deve ser negligenciada ao usar esse tipo de teste: a suposição de permutabilidade das amostras sob a hipótese nula. Também é digno de nota que esse tipo de abordagem também pode ser aplicada quando houver mais de duas amostras como a implementada no coinpacote R.

Você pode usar alguma linguagem figurada ou intuição conceitual em inglês puro para ilustrar essa suposição? Isso seria muito útil para esclarecer essa questão esquecida entre não estatísticos como eu.

Nota:
Seria muito útil mencionar um caso em que a aplicação de um teste de permutação não é válida ou inválida sob a mesma suposição.

Atualização:
Suponha que eu tenha 50 indivíduos coletados aleatoriamente na clínica local do meu distrito. Eles foram designados aleatoriamente para o medicamento recebido ou um placebo na proporção de 1: 1. Todos foram medidos para o parâmetro 1 Par1em V1 (linha de base), V2 (3 meses depois) e V3 (1 ano depois). Todos os 50 assuntos podem ser agrupados em 2 grupos com base no recurso A; Um positivo = 20 e um negativo = 30. Eles também podem ser agrupados em outros 2 grupos com base no recurso B; B positivo = 15 e B negativo = 35.
Agora, tenho valores de Par1todos os assuntos em todas as visitas. Sob a hipótese de permutabilidade, posso fazer uma comparação entre os níveis de Par1teste de permutação se:
- Compare indivíduos com droga com os que receberam placebo na V2?
- Compare assuntos com o recurso A com aqueles com o recurso B em V2?
- Compare assuntos com o recurso A em V2 com aqueles com o recurso A, mas em V3?
- Em que situação essa comparação seria inválida e violaria a suposição de permutabilidade?

doutorado
fonte
4
Suponha que eu fizesse cada observação em uma folha separada de papel solto e, enquanto lhe entregava a pilha, escorreguei, e as folhas voaram em todas as direções enquanto se acomodavam no chão. Seria uma pena se isso destruísse a validade do teste que você esperava executar nesses dados. Se suas observações forem permutáveis ​​e você aplicasse um teste com base nisso, me confortaria e me diria para não se preocupar enquanto me ajudava a recolher os papéis do chão. Caso contrário, e a coleta de dados foi especialmente cara, talvez eu precise correr pela minha vida.
cardeal
2
Por outro lado, a ordem faz importa para coisas como dados de séries temporais (em geral) e testes geralmente deve respeitar esta ordem de forma adequada.
cardeal
@ cardinal, enquanto sua história intuitiva desenhou uma imagem vívida de como essa suposição se parece, mas ainda estou confuso sobre como julgar se os documentos valiosos caídos eram permutáveis ​​ou não. Você pode concorrer a outro comentário, se for possível!
doctorado

Respostas:

7

fXYZ(x=1,y=3,z=2)=fXYZ(x=3,y=2,z=1)etc). Se esse não for o caso, a contagem de permutações não é uma maneira válida de testar a hipótese nula, pois cada permutação terá um peso diferente (probabilidade / densidade). Os testes de permutação dependem de cada atribuição de um determinado conjunto de valores numéricos para suas variáveis ​​com a mesma densidade / probabilidade.

f(x1=1,x2=2,X3=3...XN=N)f(x1=N,x2=N1,X3=N2...XN=1)


fonte
+1, embora a permutabilidade esteja bem explicada, mas ainda assim me deparei tentando aplicar a metáfora dos frascos no estudo em questão. (consulte a atualização da pergunta). Dada a duração das visitas e o sub-agrupamento com base nos recursos, como posso julgar se a comparação desses valores seria intercambiável ou não?
doctorado
@ doutor: parece que você está estratificando seus grupos por fatores que são relevantes para o resultado do Par1, correto? Enquanto você estiver usando permutações dentro de um quadrante A / B específico, então eu assumiria que seus assuntos são permutáveis. Seu primeiro teste, que abordará os recursos, precisará ser processado ainda mais antes que você possa usar um teste que depende da permutabilidade. em particular, é necessário quantificar o efeito do tratamento e corrigir os efeitos de confusão de recursos A e B - caso contrário, o tamanho goup influenciará os resultados globais (paradoxo de Simpson)
11
@ doutor: percebi que meu comentário acima pode ter sido oblíquo em relação ao que você deseja: os frascos no seu caso seriam os pares de recursos, ou seja, (A +, B +), (A-, B +), (A +, B -), (B-, A-) para um total de 4 "jarros". Isso ajuda a torná-lo mais concreto?
Tks, mas o que confunde não estatísticos como eu, é como se pode julgar se essa suposição foi cumprida ou não? freqüentemente existem testes para examinar suposições; por exemplo, para normalidade, existe o teste de Shapiro-Wilk. Mas eu me pergunto que teste examinaria a permutabilidade? caso contrário, seria uma definição muito difícil ou vaga e dois estatísticos podem não concordar com este ou aquele subgrupo. Como você mencionou, no quadrante A / B não há problema, mas no Drug / Placebo você mostrou alguma preocupação. Então, existe algum teste ácido para essa suposição?
doctorado
2
No que diz respeito à permutabilidade, não existe um "teste" para permutabilidade. Diferentemente da independência (que é testável), a permutabilidade é mais uma suposição de modelagem que, se você tivesse tirado amostras repetidas como a que você tirou, você descobriria que cada permutação ocorre exatamente na mesma fração do tempo. Você tem apenas 1 amostra e não pode "testá-la".