Faz sentido realizar um teste unilateral de Kolmogorov-Smirnov?

15

É significativo e possível realizar um teste KS unilateral? Qual seria a hipótese nula de tal teste? Ou o teste KS é inerentemente um teste bicaudal?

Eu me beneficiaria de uma resposta que me ajudasse a entender a distribuição de D (estou trabalhando no artigo de Massey, de 1951, e considero a descrição desafiadora, por exemplo, e D - o supremo e o mínimo das diferenças de valor não absoluto. diferenças nas CDFs empíricas?).D+D

Dar seguimento pergunta: como são -Valores para D + e D - obtido? Muitas publicações que estou encontrando apresentam valores apresentados, em vez de CDF de D n , D + e D - .pD+DDnD+D

Atualização: Acabei de descobrir a pergunta relacionada. Qual é a hipótese nula em um teste unilateral de Kolmogorov-Smirnov? , que eu perdi na minha varredura inicial antes de escrever esta.

Alexis
fonte

Respostas:

20

É significativo e possível realizar um teste KS unilateral?

Definitivamente.

o teste KS é inerentemente um teste bicaudal?

De modo nenhum.

Qual seria a hipótese nula de tal teste?

Você não deixa claro se está falando sobre o teste de uma amostra ou de duas amostras. Minha resposta aqui abrange os dois - se você considera como representando o cdf da população da qual uma amostra X foi extraída, é duas amostras, enquanto você obtém o caso de uma amostra considerando F X como uma distribuição hipotética ( F 0 , se você preferir).FXXFXF0

Em alguns casos, você poderia escrever o nulo como uma igualdade (por exemplo, se não fosse possível ir para o outro lado), mas se você quiser escrever um nulo direcional para uma alternativa unilateral, você pode escrever algo como isto :

H0:FY(t)FX(t)

H1:FY(t)<FX(t), por pelo menos um t

(ou o inverso para a outra cauda, ​​naturalmente)

Se somarmos uma suposição quando usamos o teste que eles são iguais ou que será menor, então a rejeição da hipótese nula implica (primeira ordem) ordenação estocástica / primeira ordem dominância estocástica . Em amostras grandes o suficiente, é possível que os F cruzem - mesmo várias vezes e ainda rejeitem o teste unilateral, de modo que a suposição é estritamente necessária para que o domínio estocástico se mantenha.FY

Vagamente se com a desigualdade estrita para, pelo menos, alguns t , em seguida, Y 'tende a ser maior' do que X .FY(t)FX(t)tYX

Adicionar suposições como essa não é estranho; é padrão. Não é particularmente diferente de supor (digamos em uma ANOVA) que uma diferença de meios se deve a uma mudança de toda a distribuição (em vez de uma mudança na assimetria, onde parte da distribuição diminui e outras mudam, mas de tal maneira maneira que a média mudou).


Então, vamos considerar, por exemplo, uma mudança na média para um normal:

insira a descrição da imagem aqui

O fato de que a distribuição para é deslocada para a direita em alguma quantidade daquela para X implica que F Y é menor que F XYXFYFX . O teste unilateral de Kolmogorov-Smirnov tenderá a rejeitar nessa situação.

Da mesma forma, considere uma mudança de escala em uma gama:

insira a descrição da imagem aqui

Novamente, a mudança para uma escala maior produz um F. menor. Novamente, o teste unilateral de Kolmogorov-Smirnov tenderá a rejeitar nessa situação.

Existem inúmeras situações em que esse teste pode ser útil.


Então, quais são D+D

D+F0DF0D+D

insira a descrição da imagem aqui

D+D

H0:FY(t)F0(t)

H1:FY(t)<F0(t), por pelo menos um t

YFF0DFY(t)<F0(t)D


D+D

Não é uma coisa simples. Há uma variedade de abordagens que foram usadas.

Se bem me lembro de uma das maneiras pelas quais a distribuição foi obtida através do uso dos processos da ponte browniana ( este documento parece apoiar essa lembrança ).

Eu acredito neste artigo, e no artigo de Marsaglia et al aqui cobrem parte do contexto e fornecem algoritmos computacionais com muitas referências.

Entre eles, você terá grande parte da história e várias abordagens que foram usadas. Se eles não cobrem o que você precisa, você provavelmente precisará fazer isso como uma nova pergunta.

Dn ,D+ e D-

Isso não é particularmente uma surpresa. Se bem me lembro, até a distribuição assintótica é obtida como uma série (essa lembrança estaria errada), e em amostras finitas é discreta e não de forma simples. Em ambos os casos, não há maneira conveniente de apresentar as informações, exceto como gráfico ou tabela.

Glen_b -Reinstate Monica
fonte
2
"Em amostras grandes o suficiente, é possível que os F cruzem - mesmo várias vezes e ainda rejeitem o teste unilateral" - observe que isso significa que você pode rejeitar o teste unilateral nas duas direções para os mesmos dados!
Hao Ye
2
@HaoYe Sim, isso é possível. Seria uma indicação clara de que o domínio estocástico seria insustentável.
Glen_b -Reinstala Monica