Existe uma alternativa ao teste de Kolmogorov-Smirnov para dados vinculados com correção?

14

Eu tenho um monte de dados de duas amostras (controle e tratamento), cada uma contendo vários milhares de valores que serão submetidos a testes de significância em R. Teoricamente, os valores devem ser contínuos, mas devido ao arredondamento feito pelo software de medição, eles não são ' te eles têm laços. As distribuições são desconhecidas e as formas de controle e distribuições tratadas podem ser diferentes, então eu gostaria de usar um teste não paramétrico para comparar se a diferença entre as amostras é significativa para 10 fatores diferentes.

Pensei em usar o teste Kolmogorov-Smirnov, mas não é realmente adequado para empates. Recentemente, deparei com uma nova biblioteca R chamada Matching, que executa uma versão de bootstrap do teste KS e tolera vínculos. Agora, isso é realmente uma boa ideia ou devo usar outro teste? E preciso ajustar o valor-p?

AnjaM
fonte
O artigo vinculado lida com a correspondência de propensão. Pode ser que o teste de autoinicialização tenha mais generalidade, mas não tenho certeza.
Michael R. Chernick
Eu teria feito uma versão aleatória de algo como o Kolmogorov-Smirnov (bem, na verdade, eu provavelmente usaria o Anderson-Darling ou o Cramer-von Mises para o KS, mas ainda com a distribuição da randomização para cuidar de laços).
Glen_b -Reinstate Monica
Você viu o código de Tom Waterhouse ?
precisa saber é o seguinte

Respostas:

13

Em vez de usar o teste KS, você pode simplesmente usar um procedimento de permutação ou reamostragem, conforme implementado na oneway_testfunção do coinpacote. Veja a resposta aceita para esta pergunta .

Atualização : Meu pacote afexcontém a função compare.2.vectorsimplementando uma permutação e outros testes para dois vetores. Você pode obtê-lo no CRAN:

install.packages("afex")

Para dois vetores xe y(atualmente) retorna algo como:

> compare.2.vectors(x,y)
$parametric
   test test.statistic test.value test.df       p
1     t              t     -1.861   18.00 0.07919
2 Welch              t     -1.861   17.78 0.07939

$nonparametric
             test test.statistic test.value test.df       p
1 stats::Wilcoxon              W     25.500      NA 0.06933
2     permutation              Z     -1.751      NA 0.08154
3  coin::Wilcoxon              Z     -1.854      NA 0.06487
4          median              Z      1.744      NA 0.17867

Quaisquer comentários sobre esta função são muito bem-vindos.

Henrik
fonte
3
(+1) Uma descrição deste e de outros testes pode ser encontrada neste blog
@ Henrik Obrigado pela sugestão e por apontar para a outra pergunta. Isso é realmente útil!
AnjaM 04/04/12
@ AnjaM De nada. Você também pode querer verificar minha atualização.
Henrik