Mediana> Modo> Média> Intervalo

8

Minha pergunta é: Existe um conjunto de dados que permite que a mediana seja maior que o modo, o modo seja maior que a média e a média seja maior que o intervalo? Em caso afirmativo, existe um padrão ou uma característica específica de um conjunto de dados para permitir essa situação (assimetria de algum tipo, talvez ...)?

PS Corrigi meu erro de digitação. Algumas das respostas já dadas estão relacionadas à situação oposta para a qual a mediana

BlueSigma
fonte
6
Seu título tem sinais, mas o texto diz "menor" em cada caso. A resposta será a mesma de qualquer maneira, mas melhor para tornar sua pergunta consistente. >
Nick Cox
5
Não há muito significado para esses critérios. Isso ocorre porque (a) concentrando uma pequena probabilidade em uma banda muito estreita, você pode criar um modo com qualquer valor sem alterar sensivelmente a média ou a mediana; (b) colocando uma pequena probabilidade em um valor extremo, você pode colocar a média em qualquer lugar dentro do intervalo sem alterar o modo ou a mediana consideravelmente; e (c) ao incluir valores extraordinariamente grandes ou pequenos com probabilidades muito pequenas, você poderá aumentar o intervalo da maneira que desejar, sem alterar sensivelmente quaisquer outras propriedades.
whuber
5
Também não faz sentido incluir alcance, uma medida da largura da distribuição, com três medidas de tendência central.
Prince_of_pears 12/12
@ Giuseppe Biondi-Zoccai Sua edição tem a intenção de ser útil, mas geralmente não editamos perguntas sempre que é possível que o OP esteja confuso em um ponto técnico, mesmo no simples uso de notação.
Nick Cox
@prince_of_pears O intervalo dimensional tem as mesmas unidades que as outras entidades, portanto, as comparações fazem sentido matemático . Concordo que de imediato não vejo um objetivo estatístico para essas comparações, mas isso é uma questão diferente e pode ser parte da questão que o OP precisa esclarecer. Considere que há muitos contextos nos quais a comparação entre DP e média faz sentido e não é habitual objetar que um mede a largura e o outro local.
Nick Cox

Respostas:

8

A pergunta já foi respondida afirmativamente, mas vamos abordar isso do ponto de vista da construção - como fazemos um conjunto de dados que faz isso?

Primeiro, observe que sempre podemos tornar as três medidas de localização maiores que o intervalo. Simplesmente construa um conjunto de dados preliminares com mediana> mode> mean e calcule o intervalo. Agora adicione (range-mean) + (para alguns pequenos positivos ) a todos os valores dos dados para obter o conjunto final de dados; então, as três medidas de localização excederão o intervalo.ϵϵ

Portanto, reduzimos agora o problema a encontrar um conjunto de dados que significa mediana> mode>.

Imagine que já tínhamos alguns dados com mediana e modo adequados. Para tornar a média menor que a mediana e o modo, basta colocar um único valor longe o suficiente abaixo da maior parte dos dados para que a média seja reduzida; podemos colocar um segundo valor logo acima da maior parte dos dados para manter a mediana onde estava, sem alterar o modo. Portanto, agora podemos modificar um conjunto de dados existente que simplesmente possui o modo mediano> e obter um que tenha a média onde queremos.

Então, vamos criar um com o modo mediano>. Podemos fazer isso repetindo um valor (se é o único valor que ocorre duas vezes, é o modo de amostra) e, em seguida, adicionamos outros valores suficientes para aumentar a mediana. Isto é um exemplo:

 21, 21, 22, 23, 24

A mediana é 22, mas o modo é 21.

Agora, vamos adicionar os dois pontos, conforme descrito anteriormente, de forma a fazer a média 20 sem alterar a mediana ou o modo. Os pontos atuais somam 111, então precisamos de dois pontos que adicionam 140-111 = 29, e um deles deve ser maior que 24. Vamos fazer 25. Então o ponto menor é 29-25 = 4.

Então agora nosso conjunto de dados é:

4, 21, 21, 22, 23, 24, 25

Tem média 20, modo 21 e mediana 22.

Agora vamos corrigir o relacionamento daqueles com o intervalo. Qual é o alcance? É 25-4 = 21, que atualmente é maior que a média. Precisamos simplesmente adicionar algo a cada valor de dados para tornar a média maior que 21, o que deixa o intervalo inalterado. Adicionar 2 será suficiente. (Observe que o intervalo médio + 1 = 2, para que possamos ver que usamos )ϵ=1

Portanto, nosso conjunto final de dados é

6, 23, 23, 24, 25, 26, 27

O intervalo ainda é 21, a média agora é 22, o modo é 23, a mediana é 24

Portanto, essa abordagem passo a passo é bastante fácil de usar. Em suma:

  1. Crie um pequeno conjunto de dados com o modo mediano> repetindo o menor valor e mantendo todos os valores maiores distintos (é mais fácil usar valores classificados). Ter 5 pontos é conveniente (pois permite especificar a mediana movendo o valor médio), mas 4 é possível, se necessário.

  2. Obtenha uma média abaixo da mediana adicionando dois pontos que não alteram a mediana ou o modo (ou seja, dois valores distintos / singleton não atrapalham o modo e, colocando-os em um dos lados, os dados anteriores preservarão a mediana; coloque o valor maior logo acima de todos os dados atuais e depois calcule o menor para que a média geral saia logo abaixo do modo, o que nos leva a 7 pontos de dados.

  3. Calcule o intervalo. Adicione uma constante (intervalo - média + ) a todos os valores dos dados, o que garante que a média exceda o intervalo. Este é o conjunto de dados final.ϵ


Verificando esses cálculos em R:

x <- c(6, 23, 23, 24, 25, 26, 27)
data.frame(
     range=diff(range(x)),
     mean=mean(x),
     mode=max(as.numeric(names(table(x))[table(x)==max(table(x))])),
     median=median(x)
   )

  range mean mode median
1    21   22   23     24

(observe que, de alguma forma, geramos mais de um modo, esse cálculo tenta encontrar o maior deles)

Glen_b -Reinstate Monica
fonte
Obrigado, esta explicação é absolutamente fantástica. Existe uma característica teórica de uma série de números? O que quero dizer é que, se o modo médio> mediano>, a distribuição é positiva, assimétrica. Por outro lado, se o modo médio <mediano <estiver inclinado negativamente. Existe uma característica distributiva nessa restrição?
BlueSigma
1. Se definir assimetria em termos de uma relação entre a média e mediana (como o coeficiente segundo Pearson assimetria , mediano-assimetria) ou em termos de uma relação entre o modo e significativo (como o primeiro coeficiente de Pearson assimetria; modo de assimetria) , em seguida uma distribuição com modo médio> mediano> é inclinada positivamente. Caso contrário, não é necessariamente o caso - por exemplo, se eu definir a assimetria em termos do terceiro momento central de uma variável padronizada (
instabilidade do
ctd ... ou em termos de inclinação do quartil, então não é necessariamente o caso que o modo> mediano> implique inclinação positiva. 2. Não tenho 100% de certeza do que você está perguntando ... a característica relevante do conjunto de números é que as estatísticas que você mencionou estão na ordem desejada, por construção. As estatísticas derivadas de diferenças nessas estatísticas (como a assimetria mediana ou a distorção do modo) serão do sinal implícito, mas é uma consequência do atendimento às condições. Fora isso, não tenho certeza do que você procura aqui.
Glen_b -Reinstala Monica
10

Sim, não é difícil criar esse conjunto.

S = {0, 1, 2, 3, 4, 4, 1000}

Mediana = 3, Modo = 4, Média = 144,85, Intervalo = 1000

Dados desse tipo serão inclinados para a direita, pois sua média é maior que a mediana, o que implica que, em média, os valores acima da mediana estão mais distantes do que os valores abaixo.

Wang nuclear
fonte
2
Esteja ciente de que a questão foi esclarecida para que as desigualdades sigam o contrário - mas isso é facilmente corrigido com um pequeno ajuste dos valores: {1000, 1996, 1996, 1997, 1998, 1999, 2000}: mediana 1997, mode = 1996, média = 1855,14, intervalo = 1000
RM
Conceitualmente, acho que é melhor pensar nisso em termos de distribuição de probabilidade. A média da mediana e o modo são valores numéricos para a variável aleatória. O intervalo é o comprimento do conjunto de valores possíveis. Não é comparável ao outro parâmetro. Para uma distribuição normal, a média, a mediana e o modo são todos iguais. Há um problema de definição sobre o modo. Se houver apenas um pico na densidade, não haverá ambiguidade. Mas se você tiver mais de um pico, alguns definem o modo como o pico mais alto, enquanto outros dizem que todos os picos são modos;
Michael R. Chernick
No caso de uma distribuição uniforme, não há modos, porque não há picos. Para distribuições unimodais simétricas com média finita, a média é igual ao modo. Para distribuições distorcidas que satisfaçam as condições de média e mediana e modo, existam e sejam únicas, qualquer ordem é possível, mas nem todas podem ser iguais.
Michael R. Chernick
@ Michael Chernick Não é assim. 0, 0, 1, 1, 1, 1, 3 tem média, mediana e modo idênticos em 1, mas não são simétricos. Para que isso não seja pensado, o binômio é manifestamente distorcido e tem média, mediana e modo idênticos em 1, e existem outros casos. (10k)0.1k0.910k,k=0,,10
Nick Cox
Em distribuições uniformes, concordo que não há modo útil, mas também seria possível argumentar que todo valor possível é um modo.
Nick Cox
4

Independentemente de qual seja o pedido, a resposta é sim. Conjuntos de dados que são subconjuntos de distribuições, cujas caudas esquerdas são mais pesadas que suas caudas direitas frequentemente terão o modo menor que a mediana e a mediana menor que a média e a média menor que o intervalo. Uma distribuição beta com o modo maior 1/2 teria essa propriedade. Se alguém quiser ter o modo em qualquer posição específica, poderá fazer uma distribuição de mistura adicionando uma pequena porcentagem de um desvio padrão estreito (pequeno), mas com uma distribuição alta, por exemplo, Dirac , onde quer que você queira colocar esse modo.δ

Carl
fonte
11
Embora para distribuições unimodais em um sentido particular, considerar a média entre o modo e a mediana mais comum com variáveis ​​aleatórias discretas do que com variáveis ​​aleatórias contínuas: veja Paul T. von Hippel, Média, Mediana e Inclinação: Corrigindo um Livro Didático Rule , Journal of Statistics Education Volume 13, Número 2 (2005) ou meus pensamentos . A regra livro, sendo muito confiante sobre uma declaração de Karl Pearson, é ter a mediana entre o modo e média
Henry
Bom ponto (+1), e o modo pode estar em qualquer lugar.
12241 Carl