Observo os tempos de processamento de um processo antes e depois de uma alteração para descobrir se o processo melhorou com a alteração. O processo melhorou, se o tempo de processamento for reduzido. A distribuição do tempo de processamento é baseada em gordura, portanto, comparar com base na média não é sensato. Em vez disso, gostaria de saber se a probabilidade de observar um tempo de processamento menor após a alteração é significativamente acima de 50%.
Seja a variável aleatória do tempo de processamento após a alteração e a anterior. Se estiver significativamente acima de , eu diria que o processo melhorou.
Agora tenho observações dos e observações de . O observada probabilidade de é p = 1.
O que posso dizer sobre dadas as observações x i e y j ?
fonte
O @jbowman fornece uma solução padrão (agradável) para o problema de estimar conhecido como modelo de resistência ao estresse .θ=P(X<Y)
Outra alternativa não paramétrica foi proposta em Baklizi e Eidous (2006) para o caso em que e Y são independentes. Isso é descrito abaixo.X Y
Por definição, temos que
This is implemented in the following R code using a Gaussian kernel.
In order to obtain a confidence interval forθ you can get a bootstrap sample of this estimator as follows.
Other sorts of bootstrap intervals might be considered as well.
fonte
Consider the paired differenceXi−Yi , P(Xi−Yi<0)=p then I{Xi−Yi<0} for i=1,2,..,n are iid Bernoulli random variables. So the number X of Xi<Yi is binomial n p=P(Xi−Yi<0) . Then X/n is an unbiased estimate of the probability and confidence intervals and hypothesis tests can be done base on the binomial.
fonte