Você pode usar o teste Kolmogorov-Smirnov para testar diretamente a equivalência de duas distribuições?

8

Falou-se sobre outras questões de como alguém poderia usar a abordagem Testa (dois testes unilaterais) para o teste de Kolmogorov-Smirnov (KS), mas eu queria saber se era possível usar diretamente a estatística de teste para mostrar que dois distribuições foram semelhantes?

Pelo que entendi, a estatística do teste KS representa a maior diferença entre dois CDFs, com a versão de uma amostra sendo usada originalmente como um teste de qualidade do ajuste. Isso é mostrado em [1] como sendo quando a distribuição empírica ultrapassa o intervalo de confiança (ou seja, qualquer ponto está muito longe da distribuição hipotética em que está testando).

Se a versão de duas amostras é frequentemente usada para mostrar que duas distribuições são significativamente diferentes uma da outra, de maneira semelhante à versão de uma amostra, podemos inverter o cálculo dos intervalos de confiança usando para usar ( 1 - α ) = 0,95 , como forma de mostrar que a diferença máxima entre as duas distribuições é significativamente semelhante?(1α)=0.05(1α)=0.95

[1] Massey, F. "O teste de Kolmogorov-Smirnov para a adequação", Journal of the American Statistical Association , vol. 46, n. 253, pp. 68-78, março de 1951

jamesyjamesjames
fonte

Respostas:

3

H0:pH0HA:

ppp

pp=0.99.α=0.95p>α

ppn

Não é exatamente a resposta que você provavelmente estava procurando, mas também não é uma lavagem total. Espero que isto ajude!

Matt Brems
fonte
(1/2) Eu entendo que não podemos simplesmente usar um valor de p> 0,98 .. etc. - o que eu queria saber é que, se o teste KS está realmente medindo a distância máxima entre as duas distribuições, parece como se estivesse em uma posição única para realizar testes de equivalência diretamente. Por exemplo, se a estatística de teste D = 0, certamente as duas distribuições devem ser idênticas? E se for esse o caso, e D <0,0001? Parece que deve haver um ponto crítico (como quando p atravessa 0,05), em que já não pode ter a certeza de que eles são a mesma distribuição, e
jamesyjamesjames
(2/2) ... então pode virar isso de cabeça para baixo e usar 0 <D <0,05 (por exemplo) para dizer que as duas distribuições são significativamente semelhantes.
Jamesyjamesjames
1
D=0pn
1
... as distribuições são idênticas, mas você não pode estabelecer conclusivamente esse fato.
Matt Brems
2
Ah, é claro - porque é um ECDF. Sim, isso faz sentido.
Jamesyjamesjames