Eu tenho dois exemplos que eu quero testar (usando python) se eles são desenhados da mesma distribuição. Para fazer isso, uso a função estatística ks_2samp de scipy.stats. Retorna 2 valores e encontro dificuldades em interpretá-los. Ajuda por favor!
Como Stijn apontou, o teste ks retorna uma estatística D e um valor p correspondente à estatística D. A estatística D é a distância máxima absoluta (supremo) entre os CDFs das duas amostras. Quanto mais próximo esse número for de 0, maior a probabilidade de as duas amostras terem sido coletadas da mesma distribuição. Confira a página da Wikipedia para o teste ks. Ele fornece uma boa explicação: https://en.m.wikipedia.org/wiki/Kolmogorov%E2%80%93Smirnov_test
O valor p retornado pelo teste ks tem a mesma interpretação que outros valores p. Você rejeita a hipótese nula de que as duas amostras foram retiradas da mesma distribuição se o valor-p for menor que o seu nível de significância. Você pode encontrar tabelas on-line para a conversão da estatística D em um valor-p se estiver interessado no procedimento.
Ao fazer uma pesquisa no Google por ks_2samp, o primeiro hit é neste site. Nele, você pode ver a especificação da função:
fonte