Se você definir O1,O2,…,ON como a versão classificada dos dados originais X1,X2,…,XN , a mediana será definida como:
Median({O1,O2,…,ON})={O(N+1)/2(ON/2+ON/2+1)/2if N is oddotherwise
Sem solicitar seus dados, você pode usar a definição da mediana geométrica para definir a mediana em uma dimensão:
Median({X1,X2,…,XN})=argminy∑i=1N∣∣Xi−y∣∣
Observe que isso não define necessariamente uma mediana única quando há um número par de pontos; por exemplo, qualquer número otimiza o objetivo com .y∈[3,4]X={2,3,4,5}
Uma maneira alternativa de expressar a média é a estimativa dos "mínimos quadrados":
Escolher como a média fornece o menor valor da soma dos erros quadráticos.m
Agora a mediana pode ser expressa como a estimativa dos "desvios mínimos absolutos":
Escolher como a mediana fornece o menor valor da soma dos erros absolutos.m
fonte
A mediana é o valor correspondente ao meio quantil, ou seja, metade dos valores é maior, metade é menor (perdoe-me por ignorar casos com igualdade ou quando o conjunto é par ...). Como tal, dado que o pdf do conjunto de dados é conhecido, a distribuição cumulativa é facilmente avaliada. Observando esta função, entãopX X1⋅Xn PX
Tomemos, por exemplo, o caso dos ângulos neste método usado neste artigo de revisão para equalização do histograma. O painel inferior esquerdo mostra o pdf de ângulos em um conjunto de imagens naturais. é a distribuição cumulativa e a mediana é o valor de correspondente ao valor , que é aproximadamente nesse caso.p(θ) P(θ) θ 1/2 0
fonte