Minha pergunta é: Existe um conjunto de dados que permite que a mediana seja maior que o modo, o modo seja maior que a média e a média seja maior que o intervalo? Em caso afirmativo, existe um padrão ou uma característica específica de um conjunto de dados para permitir essa situação (assimetria de algum tipo, talvez ...)?
PS Corrigi meu erro de digitação. Algumas das respostas já dadas estão relacionadas à situação oposta para a qual a mediana
Respostas:
A pergunta já foi respondida afirmativamente, mas vamos abordar isso do ponto de vista da construção - como fazemos um conjunto de dados que faz isso?
Primeiro, observe que sempre podemos tornar as três medidas de localização maiores que o intervalo. Simplesmente construa um conjunto de dados preliminares com mediana> mode> mean e calcule o intervalo. Agora adicione (range-mean) + (para alguns pequenos positivos ) a todos os valores dos dados para obter o conjunto final de dados; então, as três medidas de localização excederão o intervalo.ϵ ϵ
Portanto, reduzimos agora o problema a encontrar um conjunto de dados que significa mediana> mode>.
Imagine que já tínhamos alguns dados com mediana e modo adequados. Para tornar a média menor que a mediana e o modo, basta colocar um único valor longe o suficiente abaixo da maior parte dos dados para que a média seja reduzida; podemos colocar um segundo valor logo acima da maior parte dos dados para manter a mediana onde estava, sem alterar o modo. Portanto, agora podemos modificar um conjunto de dados existente que simplesmente possui o modo mediano> e obter um que tenha a média onde queremos.
Então, vamos criar um com o modo mediano>. Podemos fazer isso repetindo um valor (se é o único valor que ocorre duas vezes, é o modo de amostra) e, em seguida, adicionamos outros valores suficientes para aumentar a mediana. Isto é um exemplo:
A mediana é 22, mas o modo é 21.
Agora, vamos adicionar os dois pontos, conforme descrito anteriormente, de forma a fazer a média 20 sem alterar a mediana ou o modo. Os pontos atuais somam 111, então precisamos de dois pontos que adicionam 140-111 = 29, e um deles deve ser maior que 24. Vamos fazer 25. Então o ponto menor é 29-25 = 4.
Então agora nosso conjunto de dados é:
Tem média 20, modo 21 e mediana 22.
Agora vamos corrigir o relacionamento daqueles com o intervalo. Qual é o alcance? É 25-4 = 21, que atualmente é maior que a média. Precisamos simplesmente adicionar algo a cada valor de dados para tornar a média maior que 21, o que deixa o intervalo inalterado. Adicionar 2 será suficiente. (Observe que o intervalo médio + 1 = 2, para que possamos ver que usamos )ϵ=1
Portanto, nosso conjunto final de dados é
O intervalo ainda é 21, a média agora é 22, o modo é 23, a mediana é 24
Portanto, essa abordagem passo a passo é bastante fácil de usar. Em suma:
Crie um pequeno conjunto de dados com o modo mediano> repetindo o menor valor e mantendo todos os valores maiores distintos (é mais fácil usar valores classificados). Ter 5 pontos é conveniente (pois permite especificar a mediana movendo o valor médio), mas 4 é possível, se necessário.
Obtenha uma média abaixo da mediana adicionando dois pontos que não alteram a mediana ou o modo (ou seja, dois valores distintos / singleton não atrapalham o modo e, colocando-os em um dos lados, os dados anteriores preservarão a mediana; coloque o valor maior logo acima de todos os dados atuais e depois calcule o menor para que a média geral saia logo abaixo do modo, o que nos leva a 7 pontos de dados.
Calcule o intervalo. Adicione uma constante (intervalo - média + ) a todos os valores dos dados, o que garante que a média exceda o intervalo. Este é o conjunto de dados final.ϵ
Verificando esses cálculos em R:
(observe que, de alguma forma, geramos mais de um modo, esse cálculo tenta encontrar o maior deles)
fonte
Sim, não é difícil criar esse conjunto.
S = {0, 1, 2, 3, 4, 4, 1000}
Mediana = 3, Modo = 4, Média = 144,85, Intervalo = 1000
Dados desse tipo serão inclinados para a direita, pois sua média é maior que a mediana, o que implica que, em média, os valores acima da mediana estão mais distantes do que os valores abaixo.
fonte
Independentemente de qual seja o pedido, a resposta é sim. Conjuntos de dados que são subconjuntos de distribuições, cujas caudas esquerdas são mais pesadas que suas caudas direitas frequentemente terão o modo menor que a mediana e a mediana menor que a média e a média menor que o intervalo. Uma distribuição beta com o modo maior 1/2 teria essa propriedade. Se alguém quiser ter o modo em qualquer posição específica, poderá fazer uma distribuição de mistura adicionando uma pequena porcentagem de um desvio padrão estreito (pequeno), mas com uma distribuição alta, por exemplo, Dirac , onde quer que você queira colocar esse modo.δ
fonte