Existe uma definição aceita para a mediana de uma amostra no plano ou espaços ordenados mais altos?

Respostas:

19

Não tenho certeza de que exista uma definição aceita para uma mediana multivariada. O que eu estou familiarizado é o ponto médio de Oja , que minimiza a soma dos volumes de simplicidades formados sobre subconjuntos de pontos. (Veja o link para uma definição técnica.)

Atualização: O site referenciado para a definição de Oja acima também possui um bom artigo que abrange várias definições de uma mediana multivariada:

ars
fonte
1
Boa referência: obrigado. Abrange de forma abrangente tudo o que é mencionado aqui.
whuber
O mesmo site também contém uma visão geral em html: cgm.cs.mcgill.ca/~athens/Geometric-Estimators/intro.html
Aditya
15

Como o @Ars disse, não há definição aceita (e esse é um bom ponto). Existem alternativas famílias gerais de maneiras de generalizar quantiles em , acho que o mais importante são:Rd

  • Generalize o processo quantil SejaPn(A) a medida empírica (= a proporção de observações emA ). Então, comA um subconjunto bem escolhido dos conjuntos de Borel emRd eλ uma medida real valorizado, você pode definir a função quantil empírico:

    Un(t)=inf(λ(A):Pn(A)tAA)

    Suponha que você pode encontrar um que lhe dá a mínima. Em seguida, o conjunto (ou um elemento do conjunto) A 1 / 2 - εA 1 / 2 + ε dá-lhe a mediana quando ε é feito pequeno o suficiente. A definição da mediana é recuperada ao usar A = ( ] - , x ] x R ) e λ ( ] - , x ] ) = x . ArsAtA1/2ϵA1/2+ϵϵA=(],x]xR)λ(],x])=xA resposta se enquadra nessa estrutura, eu acho ... a localização no meio espaço de tukey pode ser obtida usando e λ ( H x ) = x (com x R , um R d ).A(a)=(Hx=(tRd:a,tx)λ(Hx)=xxRaRd

  • definição variacional e estimação M A idéia aqui é que o quantil Q α de uma variável aleatória Y em R possa ser definido através de uma igualdade variacional.αQαYR

    • A definição mais comum é usar a função de regressão quantílica (também conhecida como perda de pinball, adivinhe por quê?) Q α = a r g inf x R E [ ρ α ( Y - x ) ] . O caso α = 1 / 2ρ 1 / 2 ( y ) = | y | e você pode generalizar isso para uma dimensão superior usando l 1ραQα=arginfxRE[ρα(Yx)]α=1/2ρ1/2(y)=|y|l1distâncias conforme feito no @Srikant Answer . Essa é a mediana teórica, mas fornece a mediana empírica se você substituir a expectativa pela expectativa empírica (média).

    • Mas Kolshinskii propõe o uso da transformação Legendre-Fenchel: desde que onde f ( s ) = 1Qα=Argsups(sαf(s))parasR. Ele dá muitas razões profundas para isso (veja o artigo;)). Generalizando este para dimensões maiores requerem trabalhar com um vectorialαe substituindosαpors,αmas você pode tomarα=(1/2,...,1/2).f(s)=12E[|sY||Y|+s]sRαsαs,αα=(1/2,,1/2)

  • Ordenação parcial Você pode generalizar a definição de quantiles em assim que você pode criar uma ordem parcial (com classes de equivalência).Rd

Obviamente, existem pontes entre as diferentes formulações. Eles não são todos óbvios ...

robin girard
fonte
Boa resposta, Robin!
quer
12

Existem maneiras distintas de generalizar o conceito de mediana para dimensões superiores. Uma ainda não mencionada, mas que foi proposta há muito tempo, é construir um casco convexo, removê-lo e repetir o máximo de tempo possível: o que resta no último casco é um conjunto de pontos que são todos candidatos a serem " medianas ".

"Bater a cabeça" é outra tentativa mais recente (c. 1980) de construir um centro robusto para uma nuvem de pontos 2D. (O link está para a documentação e o software disponíveis no Instituto Nacional do Câncer dos EUA.)

A principal razão pela qual existem várias generalizações distintas e nenhuma solução óbvia é que R1 pode ser ordenado, mas R2, R3, ... não.

whuber
fonte
Qualquer medida que coincida com a mediana usual quando restrita a R1 é uma generalização candidata. Deve haver muitos deles.
Phd3773
phv:> pode-se pedir a generalização 'the' para preservar (em dimensões mais altas) algumas das propriedades interessantes da mediana. Isso limita severamente o número de candidatos (veja os comentários após a resposta de
Srikant
@Whuber:> então a noção de ordenação pode ser generalizada para R ^ n para distribuições unimodais (veja minha resposta abaixo).
user603
@kwak: você poderia elaborar um pouco? A definição matemática usual de uma ordenação de um espaço é independente de qualquer tipo de distribuição de probabilidade; portanto, você deve implicitamente ter algumas suposições adicionais em mente.
whuber
1
@Whuber:> Você declara: "R1 pode ser pedido, mas R2, R3, ... não pode ser". R2, .., R3 pode ser ordenado de várias maneiras, mapeando de Rn para R. Uma dessas maneiras é a profundidade da tukey. Possui muitas propriedades importantes (robustez até certo ponto, não paramétrica, invariância, ...), mas elas são válidas apenas para o caso de distribuições unimodais. Deixe-me saber se você quiser mais detalhes.
user603
6

A mediana de meio espaço do Tukey pode ser estendida para> 2 dimensões usando o DEEPLOC, um algoritmo devido a Struyf e Rousseeuw; veja aqui para detalhes.

O algoritmo é usado para aproximar o ponto de maior profundidade com eficiência; Os métodos ingênuos que tentam determinar isso exatamente entram em conflito com (a versão computacional) da "maldição da dimensionalidade", onde o tempo de execução necessário para calcular uma estatística cresce exponencialmente com o número de dimensões do espaço.

Gary Campbell
fonte
0

Eu não sei se existe qualquer definição, mas vou tentar e estender a definição padrão da mediana para . Vou usar a seguinte notação:R2

, Y : as variáveis ​​aleatórias associadas às duas dimensões.XY

, m y : as medianas correspondentes.mxmy

: o pdf conjunto para nossas variáveis ​​aleatóriasf(x,y)

Para alargar a definição da mediana para , nós escolhemos m x e m y para minimizar o seguinte:R2mxmy

E(|(x,y)(mx,my)|

O problema agora é que precisamos de uma definição para o que queremos dizer com:

|(x,y)(mx,my)|

A descrição acima é, em certo sentido, uma métrica de distância e várias possíveis definições de candidatos são possíveis.

Eucliedan Metric

|(x,y)(mx,my)|=(xmx)2+(ymy)2

f(x,y)

Taxicab Metric

|(x,y)(mx,my)|=|xmx|+|ymy|

XYxy


fonte
Srikant:> Não. A definição precisa ter duas características importantes da mediana univariada. a) Invariante à transformação monótona dos dados; b) robusto à contaminação por fatores externos. Nenhuma das proporções que você propõe as possui. A profundidade de Tukey tem essas qualidades.
user603
@kwak O que você diz faz sentido.
@Srikant:> Confira o artigo de R&S citado por Gary Campbell acima;). Melhor,
user603 20/09/10
@kwak Ao pensar um pouco mais, a métrica do táxi tem os recursos que você mencionou, pois basicamente se reduz a medianas univariadas. não?
2
@Srikant:> não há resposta incorreta para as perguntas do phv porque também não há 'boas respostas'; esta área de pesquisa ainda está em desenvolvimento. Eu simplesmente queria destacar por que ainda é um problema em aberto.
user603