Estou comparando uma amostra e verificando se ela distribui como uma distribuição discreta. No entanto, não tenho muita certeza de que Kolmogorov-Smirnov se aplique. A Wikipedia parece sugerir que não. Caso contrário, como posso testar a distribuição da amostra?
29
Respostas:
Não se aplica a distribuições discretas. Consulte http://www.itl.nist.gov/div898/handbook/eda/section3/eda35g.htm, por exemplo.
Existe alguma razão para você não poder usar um teste de ajuste de qualidade qui-quadrado? consulte http://www.itl.nist.gov/div898/handbook/eda/section3/eda35f.htm para obter mais informações.
fonte
Como costuma ser o caso nas estatísticas, depende do que você quer dizer .
Se você quer dizer "Eu calculo minha estatística de teste em uma amostra extraída de uma distribuição discreta e, em seguida, procuro as tabelas padrão", obterá uma taxa de erro do tipo I mais baixa do que a que você escolheu (possivelmente muito mais baixa).
Quanto depende de "quão discreta" a distribuição é. Se a probabilidade de qualquer resultado for bastante baixa (portanto, espera-se que a proporção de valores vinculados nos dados seja baixa), isso não importará muito - muitas pessoas não teriam problemas ao executar um 5 % teste em 4,5% dizem. Por exemplo, se você estiver testando um uniforme discreto em [1.100], provavelmente não precisará se preocupar.
Mas se houver uma alta probabilidade de um valor ser vinculado, o efeito na taxa de erro do tipo I poderá ser marcado. Se você obtiver um nível de significância de 0,005 quando desejar 0,05, isso pode ser um problema, pois afetará o poder de forma correspondente.
Se, em vez disso, você quer dizer "Eu calculo minha estatística de teste em uma amostra extraída de uma distribuição discreta e depois uso um valor crítico adequado / calculo um valor p adequado para minha situação" (digamos, por exemplo, por um teste de permutação), o teste certamente é válido no sentido de que você obterá a taxa de erro tipo I correta - até a discretividade da própria estatística de teste, é claro. (Embora possa muito bem haver testes melhores para seu objetivo específico, da mesma forma que costuma ocorrer no caso contínuo.)
Observe que a distribuição da estatística de teste em si não é mais livre de distribuição, mas um teste de permutação evita esse problema.
Então, às vezes, não há problema em usar as tabelas padrão, mesmo com distribuições discretas, e mesmo quando não está bem, não é tanto a estatística do teste quanto os valores críticos / valores-p que você usa com esse problema.
fonte
fonte