Estou tentando entender como obter valores- para o teste unilateral de Kolmogorov-Smirnov e estou lutando para encontrar CDFs para e no caso de duas amostras. O abaixo é citado em alguns lugares como CDF para em um caso de uma amostra:
Além disso, whuber sez existe uma formulação ligeiramente diferente deste CDF de uma amostra (estou substituindo por em sua citação por consistência com a minha notação aqui):
Usando a transformação integral de probabilidade, Donald Knuth deriva sua distribuição (comum) na p. 57 e exercício 17 do TAoCP Volume 2. Cito:
Isso se aplicaria a hipóteses unilaterais no caso de uma amostra, como: H , em que é o CDF empírico de , e é algum CDF.
Eu acho que o , neste caso, é o valor de em sua amostra, e que é o maior inteiro em . (Isso está certo?)
Mas qual é o CDF para (ou ) quando se tem duas amostras? Por exemplo, quando H para os CDFs empíricos de e ? Como obter ? D - n 1 , n 2 0 : F A ( x ) - F B ( x ) ≤ 0 A B p + n 1 , n 2
fonte
Respostas:
Ok, vou dar uma facada nisso. Informações críticas são bem-vindas.
Na página 192 Gibbons e Chakraborti (1992), citando Hodges, 1958, comece com uma CDF de amostra pequena (exata?) Para o teste frente e verso (estou trocando a notação e por e , respectivamente):d n 1 , n 2 xm,n d n1,n2 x
Onde é produzido através de uma enumeração de caminhos (aumentando monotonicamente em e ) da origem ao ponto através de um gráfico com - substituindo por - os valores dos eixos x e y são e . Além disso, os caminhos devem obedecer à restrição de permanecer dentro dos limites (em que é o valor da estatística de teste Kolmogorov-Smirnov): n 1 n 2 ( n 1 , n 2 ) S m ( x ) F n 1 ( x ) n 1 F 1 ( x ) n 2 F 2 ( x ) xA(n1,n2) n1 n2 (n1,n2) Sm(x) Fn1(x) n1F1(x) n2F2(x) x
Abaixo está a sua imagem na Figura 3.2, fornecendo um exemplo para , com 12 desses caminhos:A(3,4)
Gibbons e Chakaborti continuam dizendo que o valor unilateral é obtido usando esse mesmo método gráfico, mas apenas com o limite inferior para e somente o superior para .D + n 1 , n 2 D - n 1 , n 2p D+n1,n2 D−n1,n2
Essas pequenas abordagens de amostra envolvem algoritmos de enumeração de caminho e / ou relações de recorrência, que sem dúvida tornam os cálculos assintóticos desejáveis. Gibbons e Chakraborti também observam os CDFs limitantes quando e aproximam do infinito, de : n 2 D n 1 , n 2n1 n2 Dn1,n2
E eles fornecem o CDF limitador de (ou ) como:D+n1,n2 D−n1,n2
Como e são estritamente não negativos, o CDF pode assumir valores diferentes de zero acima de : D - [ 0 , ∞ )D+ D− [0,∞)
Referências
Gibbons, JD e Chakraborti, S. (1992). Inferência estatística não paramétrica . Marcel Decker, Inc., 3ª edição, edição revisada e ampliada.
Hodges, JL (1958). A probabilidade de significância do teste de duas amostras de Smirnov. Arkiv för matematik . 3 (5): 469--486.
fonte