A mediana é um tipo de média, para alguma generalização de "média"?

20

O conceito de "média" percorre muito mais do que a média aritmética tradicional; estende até o ponto de incluir a mediana? Por analogia,

dados não tratadosidentidadedados não tratadossignificarmédia brutaidentidade-1média aritméticadados não tratadosdestinatáriorecíprocossignificarrecíproco médiodestinatário-1média harmônicadados não tratadosregistrologssignificarlog médioregistro-1média geométricadados não tratadosquadradoquadradossignificarquadrado médioquadrado-1raiz quadrada médiadados não tratadosclassificaçãofileirassignificarclassificação ruimclassificação-1mediana

A analogia que estou fazendo é com a média quase aritmética , dada por:

Mf(x1,...,xn)=f-1(1nEu=1nf(xEu))

Para comparação, quando dizemos que a mediana de um conjunto de dados de cinco itens é igual ao terceiro item, podemos ver que isso equivale a classificar os dados de um a cinco (o que podemos denotar por uma função f ); tomando a média dos dados transformados (que são três); e lendo o valor do item de dados que possuía a classificação três (uma espécie de f-1 ).

Nos exemplos de média geométrica, média harmônica e RMS, f foi uma função fixa que pode ser aplicada a qualquer número isoladamente. Por outro lado, atribuir uma classificação ou recuperar as classificações para os dados originais (interpolando quando necessário) requer conhecimento de todo o conjunto de dados. Além disso, nas definições que li da média quase aritmética, f é necessário para ser contínuo. A mediana é considerada como um caso especial de média quase aritmética? Em caso afirmativo, como é que f definido? Ou a mediana já foi descrita como um exemplo de alguma outra noção mais ampla de "mau"? A média quase aritmética certamente não é a única generalização disponível.

Parte da questão é terminológica (o que "significa" significa de qualquer maneira, especialmente em contraste com "tendência central" ou "média"?). Por exemplo, na literatura de sistemas de controle fuzzy , uma função de agregação é uma função crescente com e ; uma função de agregação para a qual para todo x, y \ em [a, b] é chamado de "médio" (em um senso geral). É desnecessário dizer que essa definição é incrivelmente ampla! E, neste contexto, a mediana é de fato referida como um tipo de média. ^ {[1]}F ( a , a ) = a F ( b , b ) = b min ( x , y ) F ( x , y ) max , b ]F:[uma,b]×[uma,b][uma,b]F(uma,uma)=umaF(b,b)=bx , y [ ummin(x,y)F(x,y)max(x,y)x,y[uma,b][1]Mas estou curioso para saber se as caracterizações menos amplas da média ainda podem se estender o suficiente para abranger a mediana - a chamada média generalizada (que pode ser melhor descrita como "média de potência") e a média de Lehmer , mas outras podem . Quanto vale a pena, a Wikipedia inclui "mediana" em sua lista de "outros meios" , mas sem mais comentários ou citação.

[1] : Uma definição tão ampla de média, adequadamente estendida para mais de duas entradas, parece padrão no campo do controle difuso e surgiu muitas vezes durante pesquisas na Internet para instâncias da mediana descrita como mediana; Citarei, por exemplo, Fodor, JC, e Rudas, IJ (2009), " Em algumas classes de funções de agregação migratórias ", IFSA / EUSFLAT Conf. (pp. 653-656). Aliás, este artigo observa que um dos primeiros usuários do termo "médio" ( moyenne ) foi Cauchy , no Cours d'analyse da École Royale Polytechnique, 1ère partie; Analisar algébrique (1821). Contribuições posteriores de Aczél , Chisini ,e de Finetti, no desenvolvimento de conceitos mais gerais de "média" do que Cauchy, são reconhecidos em Fodor, J. e Roubens, M. (1995), " Sobre a significância dos meios ", Journal of Computational and Applied Mathematics , 64 (1), 103-115.

Silverfish
fonte
Penso que a média aritmética, a mediana e o minério de modo geralmente são chamados de "médios" e a palavra às vezes é usada de maneira ambígua. O livro Como mentir com as estatísticas o usa como um exemplo de "mentir" com as estatísticas. (Eu compreendo a sua pergunta é mais geral de modo postá-lo como um comentário.)
Tim
@ Tim Eu tenho a impressão não científica de que é raro ver "mode" referido como "mean". Mas há definitivamente um grande nexo de confusão em torno do uso de "média" (que às vezes é usado como sinônimo de "média aritmética" e outras vezes inclui medidas de tendência central que não são absolutamente meios) e "média" (que em o uso geral, e não no sentido técnico, é usado principalmente, mas não exclusivamente, para "média aritmética"). Aliás, também é um tópico difícil para pesquisas na Internet, devido aos outros significados de "mau"!
Silverfish
3
meios (aritmético, geométrico, harmônico, acionado, exponencial, combinatório etc.) são "médias analíticas". Mediana, quantis, tantiles são "médias posicionais". A classificação é bem diferente de log, quadrado, etc, porque é a transformação monotônica de qualquer variável em variável uniforme e não há caminho de volta para a transformação.
ttnphns
Entre o termo "média generalizada" está preocupado pt.wikipedia.org/wiki/Generalized_mean
ttnphns
3
Se você permitir pesos no cálculo , a mediana poderá ser facilmente considerada como uma espécie de média. Da mesma forma, mas não de forma idêntica, o conceito de meios aparados certamente inclui medianas como um caso especial limitador ou de cortesia. stata-journal.com/article.html?article=st0313 é uma revisão relativamente recente. EuWEuxEu,EuWEu=1
Nick Cox

Respostas:

9

Aqui está uma maneira de considerar uma mediana como um "tipo geral de média" - primeiro, defina cuidadosamente sua média aritmética comum em termos de estatísticas de ordem:

x¯=EuWEux(Eu),WEu=1n.

Em seguida, substituindo essa média ordinária das estatísticas de pedidos por alguma outra função de ponderação, obtemos uma noção de "média generalizada" que explica a ordem.

Nesse caso, uma série de medidas potenciais do centro tornam-se "tipos generalizados de meios". No caso da mediana, para ímpar , e todos os outros são 0, e para pares , .w ( n + 1 ) / 2 = 1 n w nnW(n+1)/2=1nWn2=Wn2+1=12

Da mesma forma, se observarmos a estimativa M, as estimativas de localização também podem ser consideradas uma generalização da média aritmética (onde, para a média, é quadrático, é linear ou a função de peso é plana), e a mediana também se enquadra nessa classe de generalizações. Essa é uma generalização um pouco diferente da anterior.ψρψ

Existem várias outras maneiras pelas quais podemos estender a noção de "médio" que pode incluir mediana.

Glen_b -Reinstate Monica
fonte
Isso é muito legal. Intimamente relacionado a esta resposta, e discutido nos artigos citados na pergunta: a média ponderada ordenada, ou OWA
Silverfish
11

Se você considerar a média como o ponto que minimiza a função de perda quadrática SSE, a mediana é o ponto que minimiza a função de perda linear MAD e o modo é o ponto que minimiza alguma função de perda de 0-1. Nenhuma transformação necessária.

Portanto, a mediana é um exemplo de uma média de Fréchet .

Mike Anderson
fonte
3
@ Mike Anderson: Bem, isso mostra que a mídia é um meio Frechet (ver o artigo wikipedia): en.wikipedia.org/wiki/Fr%C3%A9chet_mean
b Kjetil Halvorsen
@Kjetil Excellent! O fato de a mediana ser um exemplo de média de Fréchet é exatamente uma resposta para minha pergunta "é a mediana já descrita como um exemplo de alguma outra noção mais ampla de" média "?" E +1 para Mike Anderson. Espero que esta informação seja editada na resposta.
Silverfish
2
Adicionei o comentário de @ Kjetil à resposta para que ela apareça na pesquisa do site por "Frechet mean". Graças a vocês dois.
Silverfish
4

Uma generalização fácil, porém frutífera, é a média ponderada , que . Claramente, a média comum ou de jardim é o caso especial mais simples com pesos iguais .Σ n i = 1 w i = 1 w i = 1 / nEu=1nWEuxEu/Eu=1nWEu,Eu=1nWEu=1WEu=1/n

Deixar os pesos dependerem da ordem dos valores em magnitude, do menor para o maior, aponta para vários outros casos especiais, notadamente a idéia de uma média aparada , que também é conhecida por outros nomes.

Para evitar o uso excessivo de notação onde ela não é necessária ou especialmente útil, imagine, por exemplo, ignorando os menores e os maiores valores e assumindo a média (igualmente ponderada) dos outros. Ou imagine ignorar os dois menores e os dois maiores e calcular a média dos outros; e assim por diante. O corte mais vigoroso ignoraria todos, exceto os um ou dois valores médios em ordem, dependendo se o número de valores era ímpar ou par, o que é naturalmente apenas a mediana familiar . Nada na idéia de aparar obriga a ignorar números iguais em cada extremidade de uma amostra, mas dizer mais sobre aparar assimétrico nos levaria ainda mais longe da idéia principal desse encadeamento.

Em suma, médias (não qualificadas) e medianas são casos extremos limitantes da família de médias aparadas (simétricas). A idéia geral é permitir compromissos entre um ideal de usar todas as informações nos dados e outro ideal de se proteger de pontos extremos de dados, que podem ser discrepantes não confiáveis.

Veja a referência aqui para uma revisão relativamente recente.

Nick Cox
fonte
4

A pergunta nos convida a caracterizar o conceito de "médio" em um sentido suficientemente amplo para abranger todos os meios usuais - meios de poder, meios , medianas, meios aparados - mas não tão amplamente que se torne quase inútil para dados análise. Esta resposta discute algumas das propriedades axiomáticas que qualquer definição razoavelmente útil de "médio" deve ter.Lp


Axiomas Básicos

Uma definição útil e ampla de "média" para fins de análise de dados seria qualquer sequência de funções determinísticas bem definidas para e queA R n = 1 , 2 , fn:AnAARn=1,2,...

(1) para todos (a média está entre os extremos),x = ( x 1 , x 2 , , x n ) A nmin(x)fn(x)max(x)x=(x1,x2,...,xn)UMAn

(2) é invariável sob permutações de seus argumentos (meios não se importam com a ordem dos dados), efn

(3) cada não diminui em cada um de seus argumentos (à medida que os números aumentam, sua média não pode diminuir).fn

Nós deve permitir ser um subconjunto próprio de números reais (como todos os números positivos), porque a abundância de meios, tais como médias geométricas, são definidos apenas em tais subconjuntos.UMA

Também podemos querer adicionar isso

(1 ') existe pelo menos alguns para os quais (os meios não são extremos). (Não podemos exigir que isso sempre ocorra. Por exemplo, a mediana de é igual a , que é o mínimo.)min ( x ) f n ( x ) máx ( x ) ( 0 , 0 , , 0 , 1 ) 0xUMAmin(x)fn(x)max(x)(0 0,0 0,...,0 0,1)0 0

Essas propriedades parecem capturar a idéia por trás de um "meio" ser algum tipo de "valor médio" de um conjunto de dados (não ordenados).

Axiomas de consistência

Fico ainda mais tentado a estipular o critério de consistência menos óbvio

(4.a) O intervalo de conforme varia ao longo do intervalo inclui . Em outras palavras, sempre é possível manter a média inalterada, juntando um valor apropriado a um conjunto de dados. Em conjunto com (3), isso implica que valores extremos adjacentes a um conjunto de dados puxarão a média para esses extremos.t [ min ( x ) , max ( x ) ] f n ( x ) tfn+1(t,x1,x2,...,xn)t[min(x),max(x)]fn(x)t

Se desejamos aplicar o conceito de média a uma distribuição ou "população infinita", uma maneira seria obtê-lo no limite de amostras aleatórias arbitrariamente grandes. Obviamente, o limite nem sempre pode existir (ele não existe para a média aritmética quando a distribuição não tem expectativa, por exemplo). Portanto, não quero impor axiomas adicionais para garantir a existência de tais limites, mas o seguinte parece natural e útil:

(4.b) Sempre que é delimitado e é uma sequência de amostras de uma distribuição suportada em , então o limite de existe quase certamente. Isso evita que a média "se mova" para sempre dentro de mesmo que o tamanho da amostra fique cada vez maior.x n F A f n ( x n ) AUMAxnFUMAfn(xn)UMA

Na mesma linha, poderíamos restringir ainda mais a idéia de um meio de insistir para que ele se torne um estimador melhor de "localização" à medida que o tamanho da amostra aumenta:

(4.c) Sempre que é delimitado, a variação da distribuição amostral de para uma amostra aleatória de não diminui em .f n ( X ( n ) ) X ( n ) = ( X 1 , X 2 , , X n ) F nUMAfn(X(n))X(n)=(X1,X2,...,Xn)Fn

Axioma da continuidade

Podemos considerar pedir meios para variar "bem" com os dados:

(5) é separadamente contínuo em cada argumento (uma pequena alteração nos valores dos dados não deve induzir um salto repentino em sua média).fn

Esse requisito pode eliminar algumas generalizações estranhas, mas não descarta nenhum meio conhecido. Ele descartará algumas funções de agregação.

Um axioma da invariância

Podemos conceber meios como sendo aplicáveis ​​aos dados de intervalo ou razão (no sentido conhecido de Stevens). Não podemos exigir que seja invariante sob mudanças de localização (média geométrica não é), mas pode exigir

(6) para todos e todos para os quais . Isso diz apenas que somos livres para calcular usando as unidades de medida que gostamos.xUm n λ > 0 λ xUm n f nfn(λx)=λfn(x)xUMAnλ>0 0λxUMAnfn

Todos os meios mencionados na pergunta satisfazem esse axioma, exceto por algumas funções de agregação.


Discussão

As funções gerais de agregação , conforme descritas na pergunta, não necessariamente atendem aos axiomas (1 '), (2), (3), (5) ou (6). A satisfação de quaisquer axiomas de consistência pode depender de como eles são estendidos para . n > 2f2n>2

A mediana usual da amostra desfruta de todas essas propriedades axiomáticas.

Poderíamos aumentar os axiomas de consistência para incluir

(4.d) para todosf2n(x;x)=fn(x)xUMAn.

Isso implica que, quando todos os elementos de um conjunto de dados são repetidos com a mesma frequência, a média não muda. Porém, isso pode ser muito forte: a média Winsorized não possui essa propriedade (exceto assintoticamente). O objetivo de Winsorizing no nível é fornecer resistência contra alterações em pelo menos dos dados nos extremos. Por exemplo, a média de 10% de Winsorized de é a média aritmética de , igual a , mas a média de 10% de Worsorized de é .100α% 100α%(1,2,3,6)(2,2,3,3)2.5(1,1,2,2,3,3,6,6)3.5

Não sei quais dos axiomas de consistência (4.a), (4.b) ou (4.c) seriam os mais desejáveis ​​ou úteis. Eles parecem independentes: acho que nenhum deles implica o terceiro.

whuber
fonte
(+1) Eu acho que (1 '), "meios não são extremos", é um ponto interessante. Por acaso, muitas definições naturais de média incluem o mínimo e o máximo como casos especiais ou limitantes: isso se aplica aos meios de poder , Lehmer , Fréchet , Chisini e Stolarsky . Embora pareça um pouco estranho referir-se a eles como "médio"!
Silverfish 14/02
Sim, casos limitados são inevitáveis. Mas para conjuntos de dados finitos, podemos insistir em que nem max nem min se qualificam como "meios".
whuber
Por outro lado, não só é verdade que "a mediana usual da amostra desfruta de todas essas propriedades axiomáticas", mas o mesmo ocorre com o quantil usual da amostra (a menos que eu tenha perdido alguma coisa). Também parece um pouco estranho referir-se, por exemplo, ao quartil superior como uma "média" (embora eu tenha visto isso usado como uma medida de tendência central em dados muito distorcidos). Se aceitarmos todos os outros quantis, não será mais tão perverso admitir mínimos e máximos. Mas certamente posso ver que pode ser desejável pelo menos reter o direito de excluí-los.
Silverfish
1
Não estou perturbado com a admissão de quantis no panteão de meios. Afinal, para determinadas famílias de distribuições, determinados quantis não medianos coincidirão com meios aritméticos; portanto, você poderá ter problemas se tentar eliminar essa possibilidade axiomaticamente. (Considere uma família de distribuições lognormal de DP geométrico constante, por exemplo.) Se a média aritmética não puder ser qualificada como média, tudo estará perdido!
whuber
1
Eu considerei essa abordagem e a rejeitei, como explicado na minha resposta: se você aplicar esse critério para , você eliminará a mediana como uma forma de média! n>2
whuber
2

Penso que a mediana pode ser considerada um tipo de generalização da média aritmética. Especificamente, a média aritmética e a mediana (entre outras) podem ser unificadas como casos especiais da média de Chisini.. Se você estiver executando alguma operação sobre um conjunto de valores, a média de Chisini é um número que você pode substituir por todos os valores originais do conjunto e ainda assim obter o mesmo resultado. Por exemplo, se você deseja somar seus valores, a substituição de todos os valores pela média aritmética produzirá a mesma soma. A idéia é que um determinado valor seja representativo dos números no conjunto no contexto de uma determinada operação sobre esses números. (Uma implicação interessante desse modo de pensar é que um determinado valor - a média aritmética - só pode ser considerado representativo sob a suposição de que você está fazendo certas coisas com esses números.)

Isso é menos óbvio para a mediana (e observo que a mediana não está listada como um dos meios de Chisini no Wolfram ou na Wikipedia ), mas se você permitir operações sobre classificações, a mediana pode se encaixar na mesma idéia.

- Reinstate Monica
fonte
Esta é uma sugestão muito interessante. Você poderia sugerir uma operação adequada, para que, para uma mediana , tivéssemos ? f ( H , H , . . . , H ) = f ( x 1 , x 2 , . . . , X n )Mf(M,M,...,M)=f(x1,x2,...,xn)
Silverfish
Essa é uma boa pergunta, @ Silverfish, eu tenho pensado nisso ;-). Meu pensamento é mais do que, em sua Q & discussão nos comentários, a estrutura conceitual parece ser como obter a média e como recuperar os dados da média; OTOH, meu enquadramento é o que usamos para dizer: viz como uma representação compactada dos dados com a perda mínima de informações.
gung - Restabelece Monica
Eu adicionei algumas citações à pergunta que mostram uma ampla gama de estruturas conceituais, incluindo esta. No momento, não consigo ver um melhor do que "pegar a mediana", o que não parece muito dentro do espírito da peça! f
Silverfish
@ Silverfish, admito que isso parece um buraco um tanto problemático na minha posição.
gung - Restabelece Monica
Embora o insight da configuração de Chisini seja que, por exemplo, a média aritmética preserva a soma, enquanto a média geométrica preserva o produto, ainda é verdade (apenas menos interessante) que a média aritmética de também é e assim por diante. Portanto, não estou convencido de que seja um golpe fatal. ˉ x(x¯,x¯,...,x¯)x¯
Silverfish
-1

A questão não está bem definida. Se concordarmos com a definição "média" comum de média como a soma de n números divididos por n, teremos uma aposta no terreno. Além disso, se examinarmos as medidas de tendência central, poderíamos dizer que Média e Mediana são generealização, mas não uma da outra. Parte da minha formação é em não paramétricos, então eu gosto da mediana e da robustez que ela fornece, invariância à transformação monotônica e muito mais. mas cada medida tem seu lugar, dependendo do objetivo.

Bob Clauss
fonte
2
Bem-vindo ao nosso site, Bob. Acredito que se você ler o final da pergunta - especialmente o penúltimo parágrafo longo - descobrirá que ela é precisa e bem definida. (Caso contrário, seria uma boa idéia explicar o que você quer dizer com "não está bem definido".) Seus comentários realmente não abordam o que está sendo solicitado.
whuber
1
Na verdade, simpatizo com o sentimento de Bob de que a pergunta não é muito bem definida, no sentido de que o conceito de "mau" não tem uma única definição, mas tentei o meu melhor para deixar as coisas o mais claras possível. Espero que minha edição mais recente ajude a esclarecer as coisas.
Silverfish
1
A razão pela qual sinto que a pergunta tem algum valor além da mera terminologia (o que significa dizer de qualquer maneira, e existe uma definição que possamos estender até incluir a mediana?) É que pode ser instrutivo ver a mediana como apenas uma membro de uma família de generalizações da média; O exemplo de Nick Cox da mediana como um caso limitante da média aparada é particularmente bom - ele se encaixa perfeitamente na propriedade "robustez" que você gosta. Na família de médias aparadas, a média aritmética da "rua" e a mediana estão em extremidades opostas, com um espectro entre elas.
Silverfish