O conceito de "média" percorre muito mais do que a média aritmética tradicional; estende até o ponto de incluir a mediana? Por analogia,
A analogia que estou fazendo é com a média quase aritmética , dada por:
Para comparação, quando dizemos que a mediana de um conjunto de dados de cinco itens é igual ao terceiro item, podemos ver que isso equivale a classificar os dados de um a cinco (o que podemos denotar por uma função ); tomando a média dos dados transformados (que são três); e lendo o valor do item de dados que possuía a classificação três (uma espécie de ).
Nos exemplos de média geométrica, média harmônica e RMS, foi uma função fixa que pode ser aplicada a qualquer número isoladamente. Por outro lado, atribuir uma classificação ou recuperar as classificações para os dados originais (interpolando quando necessário) requer conhecimento de todo o conjunto de dados. Além disso, nas definições que li da média quase aritmética, é necessário para ser contínuo. A mediana é considerada como um caso especial de média quase aritmética? Em caso afirmativo, como é que definido? Ou a mediana já foi descrita como um exemplo de alguma outra noção mais ampla de "mau"? A média quase aritmética certamente não é a única generalização disponível.
Parte da questão é terminológica (o que "significa" significa de qualquer maneira, especialmente em contraste com "tendência central" ou "média"?). Por exemplo, na literatura de sistemas de controle fuzzy , uma função de agregação é uma função crescente com e ; uma função de agregação para a qual para todo x, y \ em [a, b] é chamado de "médio" (em um senso geral). É desnecessário dizer que essa definição é incrivelmente ampla! E, neste contexto, a mediana é de fato referida como um tipo de média. ^ {[1]}F ( a , a ) = a F ( b , b ) = b min ( x , y ) ≤ F ( x , y ) ≤ max , b ]x , y ∈ [ umMas estou curioso para saber se as caracterizações menos amplas da média ainda podem se estender o suficiente para abranger a mediana - a chamada média generalizada (que pode ser melhor descrita como "média de potência") e a média de Lehmer , mas outras podem . Quanto vale a pena, a Wikipedia inclui "mediana" em sua lista de "outros meios" , mas sem mais comentários ou citação.
: Uma definição tão ampla de média, adequadamente estendida para mais de duas entradas, parece padrão no campo do controle difuso e surgiu muitas vezes durante pesquisas na Internet para instâncias da mediana descrita como mediana; Citarei, por exemplo, Fodor, JC, e Rudas, IJ (2009), " Em algumas classes de funções de agregação migratórias ", IFSA / EUSFLAT Conf. (pp. 653-656). Aliás, este artigo observa que um dos primeiros usuários do termo "médio" ( moyenne ) foi Cauchy , no Cours d'analyse da École Royale Polytechnique, 1ère partie; Analisar algébrique (1821). Contribuições posteriores de Aczél , Chisini ,e de Finetti, no desenvolvimento de conceitos mais gerais de "média" do que Cauchy, são reconhecidos em Fodor, J. e Roubens, M. (1995), " Sobre a significância dos meios ", Journal of Computational and Applied Mathematics , 64 (1), 103-115.
Respostas:
Aqui está uma maneira de considerar uma mediana como um "tipo geral de média" - primeiro, defina cuidadosamente sua média aritmética comum em termos de estatísticas de ordem:
Em seguida, substituindo essa média ordinária das estatísticas de pedidos por alguma outra função de ponderação, obtemos uma noção de "média generalizada" que explica a ordem.
Nesse caso, uma série de medidas potenciais do centro tornam-se "tipos generalizados de meios". No caso da mediana, para ímpar , e todos os outros são 0, e para pares , .w ( n + 1 ) / 2 = 1 n w nn W( n + 1 ) / 2= 1 n Wn2= wn2+ 1= 12
Da mesma forma, se observarmos a estimativa M, as estimativas de localização também podem ser consideradas uma generalização da média aritmética (onde, para a média, é quadrático, é linear ou a função de peso é plana), e a mediana também se enquadra nessa classe de generalizações. Essa é uma generalização um pouco diferente da anterior.ψρ ψ
Existem várias outras maneiras pelas quais podemos estender a noção de "médio" que pode incluir mediana.
fonte
Se você considerar a média como o ponto que minimiza a função de perda quadrática SSE, a mediana é o ponto que minimiza a função de perda linear MAD e o modo é o ponto que minimiza alguma função de perda de 0-1. Nenhuma transformação necessária.
Portanto, a mediana é um exemplo de uma média de Fréchet .
fonte
Uma generalização fácil, porém frutífera, é a média ponderada , que . Claramente, a média comum ou de jardim é o caso especial mais simples com pesos iguais .Σ n i = 1 w i = 1 w i = 1 / n∑ni = 1WEuxEu/ ∑ni = 1WEu, ∑ni = 1WEu= 1 WEu= 1 / n
Deixar os pesos dependerem da ordem dos valores em magnitude, do menor para o maior, aponta para vários outros casos especiais, notadamente a idéia de uma média aparada , que também é conhecida por outros nomes.
Para evitar o uso excessivo de notação onde ela não é necessária ou especialmente útil, imagine, por exemplo, ignorando os menores e os maiores valores e assumindo a média (igualmente ponderada) dos outros. Ou imagine ignorar os dois menores e os dois maiores e calcular a média dos outros; e assim por diante. O corte mais vigoroso ignoraria todos, exceto os um ou dois valores médios em ordem, dependendo se o número de valores era ímpar ou par, o que é naturalmente apenas a mediana familiar . Nada na idéia de aparar obriga a ignorar números iguais em cada extremidade de uma amostra, mas dizer mais sobre aparar assimétrico nos levaria ainda mais longe da idéia principal desse encadeamento.
Em suma, médias (não qualificadas) e medianas são casos extremos limitantes da família de médias aparadas (simétricas). A idéia geral é permitir compromissos entre um ideal de usar todas as informações nos dados e outro ideal de se proteger de pontos extremos de dados, que podem ser discrepantes não confiáveis.
Veja a referência aqui para uma revisão relativamente recente.
fonte
A pergunta nos convida a caracterizar o conceito de "médio" em um sentido suficientemente amplo para abranger todos os meios usuais - meios de poder, meios , medianas, meios aparados - mas não tão amplamente que se torne quase inútil para dados análise. Esta resposta discute algumas das propriedades axiomáticas que qualquer definição razoavelmente útil de "médio" deve ter.eup
Axiomas Básicos
Uma definição útil e ampla de "média" para fins de análise de dados seria qualquer sequência de funções determinísticas bem definidas para e queA ⊂ R n = 1 , 2 , …fn: An→ A A ⊂ R n = 1 , 2 , …
(1) para todos (a média está entre os extremos),x = ( x 1 , x 2 , … , x n ) ∈ A nmin ( x ) ≤ fn( x ) ≤ máx ( x ) x =( x1, x2, … , Xn) ∈ An
(2) é invariável sob permutações de seus argumentos (meios não se importam com a ordem dos dados), efn
(3) cada não diminui em cada um de seus argumentos (à medida que os números aumentam, sua média não pode diminuir).fn
Nós deve permitir ser um subconjunto próprio de números reais (como todos os números positivos), porque a abundância de meios, tais como médias geométricas, são definidos apenas em tais subconjuntos.UMA
Também podemos querer adicionar isso
(1 ') existe pelo menos alguns para os quais (os meios não são extremos). (Não podemos exigir que isso sempre ocorra. Por exemplo, a mediana de é igual a , que é o mínimo.)min ( x ) ≠ f n ( x ) ≠ máx ( x ) ( 0 , 0 , … , 0 , 1 ) 0x ∈A min ( x ) ≠ fn( x ) ≠ máx ( x ) ( 0 , 0 , … , 0 , 1 ) 0 0
Essas propriedades parecem capturar a idéia por trás de um "meio" ser algum tipo de "valor médio" de um conjunto de dados (não ordenados).
Axiomas de consistência
Fico ainda mais tentado a estipular o critério de consistência menos óbvio
(4.a) O intervalo de conforme varia ao longo do intervalo inclui . Em outras palavras, sempre é possível manter a média inalterada, juntando um valor apropriado a um conjunto de dados. Em conjunto com (3), isso implica que valores extremos adjacentes a um conjunto de dados puxarão a média para esses extremos.t [ min ( x ) , max ( x ) ] f n ( x ) tfn + 1( t , x1, x2, … , Xn) t [ min ( x ) , max ( x ) ] fn( X ) t
Se desejamos aplicar o conceito de média a uma distribuição ou "população infinita", uma maneira seria obtê-lo no limite de amostras aleatórias arbitrariamente grandes. Obviamente, o limite nem sempre pode existir (ele não existe para a média aritmética quando a distribuição não tem expectativa, por exemplo). Portanto, não quero impor axiomas adicionais para garantir a existência de tais limites, mas o seguinte parece natural e útil:
(4.b) Sempre que é delimitado e é uma sequência de amostras de uma distribuição suportada em , então o limite de existe quase certamente. Isso evita que a média "se mova" para sempre dentro de mesmo que o tamanho da amostra fique cada vez maior.x n F A f n ( x n ) AUMA xn F UMA fn( xn) UMA
Na mesma linha, poderíamos restringir ainda mais a idéia de um meio de insistir para que ele se torne um estimador melhor de "localização" à medida que o tamanho da amostra aumenta:
(4.c) Sempre que é delimitado, a variação da distribuição amostral de para uma amostra aleatória de não diminui em .f n ( X ( n ) ) X ( n ) = ( X 1 , X 2 , … , X n ) F nUMA fn( X( N )) X( N )= ( X1, X2, … , Xn) F n
Axioma da continuidade
Podemos considerar pedir meios para variar "bem" com os dados:
(5) é separadamente contínuo em cada argumento (uma pequena alteração nos valores dos dados não deve induzir um salto repentino em sua média).fn
Esse requisito pode eliminar algumas generalizações estranhas, mas não descarta nenhum meio conhecido. Ele descartará algumas funções de agregação.
Um axioma da invariância
Podemos conceber meios como sendo aplicáveis aos dados de intervalo ou razão (no sentido conhecido de Stevens). Não podemos exigir que seja invariante sob mudanças de localização (média geométrica não é), mas pode exigir
(6) para todos e todos para os quais . Isso diz apenas que somos livres para calcular usando as unidades de medida que gostamos.x ∈ Um n λ > 0 λ x ∈ Um n f nfn( λ x ) = λ fn( X ) x ∈ An λ > 0 λ x ∈ An fn
Todos os meios mencionados na pergunta satisfazem esse axioma, exceto por algumas funções de agregação.
Discussão
As funções gerais de agregação , conforme descritas na pergunta, não necessariamente atendem aos axiomas (1 '), (2), (3), (5) ou (6). A satisfação de quaisquer axiomas de consistência pode depender de como eles são estendidos para . n > 2f2 n > 2
A mediana usual da amostra desfruta de todas essas propriedades axiomáticas.
Poderíamos aumentar os axiomas de consistência para incluir
(4.d) para todosf2 n( x ; x ) = fn( X ) x ∈ An.
Isso implica que, quando todos os elementos de um conjunto de dados são repetidos com a mesma frequência, a média não muda. Porém, isso pode ser muito forte: a média Winsorized não possui essa propriedade (exceto assintoticamente). O objetivo de Winsorizing no nível é fornecer resistência contra alterações em pelo menos dos dados nos extremos. Por exemplo, a média de 10% de Winsorized de é a média aritmética de , igual a , mas a média de 10% de Worsorized de é .100 α % 100 α % ( 1 , 2 , 3 , 6 ) ( 2 , 2 , 3 , 3 ) 2.5 ( 1 , 1 , 2 , 2 , 3 , 3 , 6 , 6 ) 3.5
Não sei quais dos axiomas de consistência (4.a), (4.b) ou (4.c) seriam os mais desejáveis ou úteis. Eles parecem independentes: acho que nenhum deles implica o terceiro.
fonte
Penso que a mediana pode ser considerada um tipo de generalização da média aritmética. Especificamente, a média aritmética e a mediana (entre outras) podem ser unificadas como casos especiais da média de Chisini.. Se você estiver executando alguma operação sobre um conjunto de valores, a média de Chisini é um número que você pode substituir por todos os valores originais do conjunto e ainda assim obter o mesmo resultado. Por exemplo, se você deseja somar seus valores, a substituição de todos os valores pela média aritmética produzirá a mesma soma. A idéia é que um determinado valor seja representativo dos números no conjunto no contexto de uma determinada operação sobre esses números. (Uma implicação interessante desse modo de pensar é que um determinado valor - a média aritmética - só pode ser considerado representativo sob a suposição de que você está fazendo certas coisas com esses números.)
Isso é menos óbvio para a mediana (e observo que a mediana não está listada como um dos meios de Chisini no Wolfram ou na Wikipedia ), mas se você permitir operações sobre classificações, a mediana pode se encaixar na mesma idéia.
fonte
A questão não está bem definida. Se concordarmos com a definição "média" comum de média como a soma de n números divididos por n, teremos uma aposta no terreno. Além disso, se examinarmos as medidas de tendência central, poderíamos dizer que Média e Mediana são generealização, mas não uma da outra. Parte da minha formação é em não paramétricos, então eu gosto da mediana e da robustez que ela fornece, invariância à transformação monotônica e muito mais. mas cada medida tem seu lugar, dependendo do objetivo.
fonte