Dois testes unilaterais de equivalência (TOST) foram estruturados para o teste de Kolmogorov – Smirnov para testar a hipótese nula negativista de que duas distribuições diferem pelo menos em algum nível especificado pelo pesquisador?
Se não for TOST, alguma outra forma de teste de equivalência?
Nick Stauner salienta sabiamente que (eu já deveria saber;) que existem outros testes de equivalência TOST não paramétricos para hipóteses nulas para equivalência estocástica e, com suposições mais restritivas, para equivalência mediana.
kolmogorov-smirnov
equivalence
tost
Alexis
fonte
fonte
Respostas:
Ok, aqui está minha primeira tentativa. Apreciação minuciosa e comentários apreciados!
As hipóteses de duas amostras
Se podemos enquadrar testes de hipótese de Kolmogorov-Smirnov de duas amostras com uma face , com hipóteses nulas e alternativas ao longo destas linhas:
H 0 : F Y ( t ) ≥ F X ( t ) , e0: FY(t)≥FX(t)
H A : F Y ( t ) < F X ( t ) , por pelo menos um t , em que:A: FY(t)<FX(t) t
a estatística de testeD−=|mint(FY(t)−FX(t))| corresponde a H 0 : F Y ( t ) ≥ F X ( t ) ;0: FY(t)≥FX(t)
a estatística de testeD+=|maxt(FY(t)−FX(t))| corresponde a H 0 : F Y ( t ) ≤ F X ( t ) ; e0: FY(t)≤FX(t)
deve ser razoável criar uma hipótese geral de intervalo para um teste de equivalência ao longo destas linhas (assumindo que o intervalo de equivalência seja simétrico no momento):
H - 0 : | F Y ( t ) - F X ( t ) | ≥ Δ , e−0: |FY(t)−FX(t)|≥Δ
H - A : | F Y ( t ) - F X ( t ) | < Δ , por pelo menos um t .−A: |FY(t)−FX(t)|<Δ t
Isto se traduziria para o específico dois unilateral "negativista" hipóteses nulas para teste de equivalência (estas duas hipóteses assumir a mesma forma, uma vez que ambos e D - são estritamente não-negativo):D+ D−
H - 01 : D + ≥ Δ , ou−01: D+≥Δ
H - 02 : D - ≥ Δ .−02: D−≥Δ
Rejeitando ambos H - 01 e H - 02 iria levar à conclusão de que - Δ < F Y ( t ) - F X ( t ) < Δ . Obviamente, o intervalo de equivalência não precisa ser simétrico, e - Δ e Δ podem ser substituídos por Δ 2 (inferior) e Δ 1 (superior) para as respectivas hipóteses nulas unilaterais.−01 −02 −Δ<FY(t)−FX(t)<Δ −Δ Δ Δ2 Δ1
As estatísticas de teste (atualizadas: Delta estão fora do sinal de valor absoluto)D+1 D−2 nY nX −01 −02
As estatísticas de teste e D - 2 (deixando implícitos n Y e n X ) correspondem a H - 01 e H - 02 , respectivamente, e são:
O limiar de equivalência / relevância[−Δ,Δ] [Δ2,Δ1] D+ D− nY nX D+ D− nY,nX 0 t<0 , and for t≥0 :
O intervalo - ou [ Δ 2 , Δ 1 ] , se estiver usando um intervalo de equivalência assimétrico - é expresso em unidades de D + e D - ou a magnitude das probabilidades diferenciadas. À medida que n Y e n X se aproximam do infinito, o CDF de D + ou D - para n Y , n X se aproxima de 0 para t
So it seems to me that the PDF for sample size-scaledD+ (or sample size-scaled D− ) must be 0 for t<0 , and for t≥0 :
Glen_b points out that this is a Rayleigh distribution withσ=12 . So the large sample quantile function for sample size-scaled D+ and D− is:
and a liberal choice ofΔ might be the critical value Qα+σ/2=Qα+14 , and a more strict choice the critical value Qα+σ/4=Qα+18 .
fonte
An alternative to TOST in equivalence testing is based on the confidence interval approach:
LetΔ denote the prespecified equivalence margin and
Now, if a 90% confidence interval forθ is completely within [−Δ,Δ] , then we may be 95% certain that θ is enough close to 0 to speak of "equivalence".
Without knowing the underlying distributions, it seems to be hopeless to derive an approximate analytic confidence interval, so we might need to rely on (bias corrected) bootstrap confidence intervals based on resampling from pairsX and Y . (I don't want to find conditions for their validity in this particular application though...)
fonte