Contra-exemplos em que a mediana está fora de [Mode-Mean]

11

Este artigo está acima da minha liga, mas fala sobre um tópico no qual estou interessado, a relação entre média, moda e mediana. Diz :

Acredita-se amplamente que a mediana de uma distribuição unimodal é "geralmente" entre a média e o modo. No entanto, isso nem sempre é verdade...

Minha pergunta : alguém pode fornecer exemplos de distribuições unimodais contínuas (idealmente simples) onde a mediana está fora do intervalo [mode, mean]? Por exemplo, uma distribuição como mode < mean < median.

=== EDIT =======

Já existem boas respostas de Glen_b e Francis, mas percebi que o que realmente me interessa é um exemplo em que modo <média <mediana ou mediana <média <modo (que é a mediana está fora de [mode, mean] E a mediana é "do mesmo lado" como média do modo (ou seja, modo acima ou abaixo)). Posso aceitar as respostas aqui, abrir uma nova pergunta ou talvez alguém possa sugerir uma solução aqui diretamente?

Janthelme
fonte
Não é difícil estender a resposta para cobrir o caso mais restrito.
Glen_b -Reinstala Monica
2
Confira a figura 6 aqui: ww2.amstat.org/publications/jse/v13n2/vonhippel.html, que fornece um exemplo Weibull (unimodal contínuo) em que a mediana não está entre o modo e a média.
Matthew Towers

Respostas:

14

Claro, não é difícil encontrar exemplos - mesmo os unimodais contínuos - em que a mediana não está entre a média e o modo.

  1. Considere iid a partir de uma distribuição triangular no formatof T ( t ) = 2 ( 1 - t ) 1 0 < t < 1T1,T2fT(t)=2(1t)10<t<1

    Agora seja uma mistura 60-40 de e .T 1 - 4 t 2XT14T2

    A densidade do é assim:X

    Mistura de duas densidades triangulares com a mediana fora do intervalo médio-modo

    A média está abaixo de 0, o modo está em 0, mas a mediana está acima de 0. Uma pequena modificação disso daria um exemplo em que até a densidade (e não apenas o cdf) era contínua, mas a relação entre medidas de localização era o mesmo (editar: veja 3. abaixo).

  2. Generalizando, vamos colocar uma proporção (com ) da probabilidade total no triângulo do lado direito e uma proporção no triângulo do lado esquerdo (no lugar dos 0,6 e 0,4 nós tínhamos antes). Além disso, faça o fator de escala na metade esquerda vez de (com ):0 < p < 1 ( 1 - p ) - β - 4 β > 0p0<p<1(1p)β4β>0

    densidade para a versão generalizada dessa mistura de duas densidades triangulares

    Agora, assumindo , a mediana sempre estará no intervalo coberto pelo triângulo retângulo; portanto, a mediana excederá o modo (que sempre permanecerá em ). Em particular, quando , a mediana estará em . 0p>1p>120 1-1/p>1211/2p

    A média será em .(pβ(1p))/3

    Se , a média estará abaixo do modo e, se a média estará acima do modo.β>p/(1p)β<p/(1p)

    Por outro lado, queremos que mantenha a média abaixo da mediana.(pβ(1p))/3<11/2p

    Considere ; isso coloca a mediana acima do modo.p=0.7

    Então satisfaria portanto a média está acima do modo.β=2β<p/(1p)

    A mediana está atualmente em enquanto a média está em . Portanto, para e , temos modo <média <mediana.11/1.40.15480.72(0.3)30.0333p=0.7β=2

    (Nota: para consistência com a minha notação, a variável no eixo x para ambas as plotagens deve ser vez de mas não vou voltar e corrigi-la.)xt

  3. Este é um exemplo em que a densidade em si é contínua. É baseado na abordagem em 1. e 2. acima, mas com o "salto" substituído por uma ladeira íngreme (e, em seguida, toda a densidade caiu cerca de 0 porque eu quero um exemplo que pareça inclinado à direita).

    densidade linear contínua, por partes, com mediana <média <modo

    [Usando a abordagem "mistura de densidades triangulares", ela pode ser gerada como uma mistura de 3 variáveis ​​independentes da forma triangular descrita na seção 1. Temos agora 15% , 60% e 25% .]T13T25T3

    Como podemos ver no diagrama acima, a média está no meio, conforme solicitado.


  1. Observe que m_t_ menciona o Weibull nos comentários (para os quais a mediana está fora do intervalo para um pequeno intervalo do parâmetro de forma ). Isso é potencialmente satisfatório porque é uma distribuição contínua (e suave) unimodal bem conhecida com forma funcional simples.k[mode,mean]k

    Em particular, para valores pequenos do parâmetro de forma Weibull, a distribuição é inclinada para a direita e temos a situação usual de mediana entre o modo e a média, enquanto que para valores grandes do parâmetro de forma Weibull, a distribuição é inclinada para a esquerda , e novamente temos a situação "mediana no meio" (mas agora com o modo à direita e não à média). Entre esses casos, há uma pequena região onde a mediana está fora do intervalo do modo médio e, no meio disso, a média e o modo passam:

          k                 order
     (0,3.2589)      mode < median < mean
      ≈ 3.2589       mode = median < mean
    (3.2589,3.3125)  median < mode < mean    (1)
      ≈ 3.3215       median < mode = mean
    (3.3215,3.4395)  median < mean < mode    (2)
      ≈ 3.4395       median = mean < mode
      3.4395+        mean < median < mode
      (≈3.60235      moment-skewness = 0)
    

    Escolhendo valores convenientes para o parâmetro shape nos intervalos marcados (1) e (2) acima - aqueles em que as diferenças entre as estatísticas de localização são quase iguais - obtemos:

    Densidades de Weibull com mediana fora do intervalo médio-modo

    Embora atendam aos requisitos, infelizmente os três parâmetros de localização estão tão próximos que não podemos distingui-los visualmente (todos caem no mesmo pixel), o que é um pouco decepcionante - os casos dos meus exemplos anteriores são muito mais separados. (No entanto, sugere situações a serem examinadas com outras distribuições, algumas das quais podem fornecer resultados visualmente mais distintos.)

Glen_b -Reinstate Monica
fonte
Isso funciona, obrigado. Por curiosidade, qual seria uma "distribuição triangular" semelhante onde modo <média <mediana? (aqui mediana <modo <dizer)
Janthelme
Na verdade, no meu exemplo original, significa <mode <median; você tinha as desigualdades para trás lá. Agora adicionei um exemplo semelhante em que a média está acima do modo, mas abaixo da mediana (na verdade, você poderia simplesmente substituir o original por exemplo, e manter as proporções da mistura em para a parte correta e para a parte esquerda). 4T21.25T20.60.4
Glen_b -Reinstala Monica
6

O exemplo a seguir é retirado dos Contra- exemplos de Probabilidade de Jordan Stoyanov .

cλX

f(x)={ceλ(xc),x(c,)x,x(0,c]0,x(,0].
μmMXf ( x ) c 2
μ=c33+c2λ+cλ2,m=1,M=c.
f(x)c1λ2c>111.0001μ>cM=cmμM
c22+cλ=1.
c1λ2c>11 (digamos ), podemos descobrir que e , então mediana não cair entre e .1.0001μ>cM=cmμM
Francis
fonte
0

Tome a distribuição exponencial com o parâmetro de taxa ae densidade a exp (-ax) para 0 <= x <infinito. O modo está em zero. Obviamente, a média e a mediana são maiores que 0. O cdf é 1-exp (-ax). Portanto, para a mediana resolva para exp (-ax) = 0,5 para x. Então -ax = ln (0,5) ou x = -ln (0,5) / a. Para a média, integre ax exp (-ax) de 0 ao infinito. Tome a = 1 e temos uma mediana = -ln (0,5) = ln (2) e média = 1.

Então modo <mediana <média.

Michael R. Chernick
fonte
1
Desculpe, mas não estamos procurando distribuições onde mode <mean <median (ou mais geralmente onde median está fora de [mode, average])?
Janthelme
3
Desculpe pela confusão, eu adicionei à pergunta original, mas o que eu estava perguntando originalmente é para exemplos em que a mediana está fora de [mode, mean] enquanto eu acho que a mediana está dentro de [mode, median] no seu exemplo.
Janthelme
3
Michael, a pergunta não pede um caso em que a mediana esteja entre o modo e a média. Você citou incorretamente o original em seu comentário logo acima deste; a pergunta não diz "mode <median <mean" onde você afirma (e nunca o fez em nenhum momento do histórico de edições). Como resultado, sua resposta fornece um caso que não é solicitado; de fato, é a situação usual (mediana no meio das outras duas) da qual a pergunta busca exceções. Quase toda distribuição unimodal distorcida bem conhecida tem a mediana no meio - o truque é encontrar outras que não fazem isso.
Glen_b -Reinstala Monica
1
O histórico de edições está disponível clicando no link vermelho na parte inferior da pergunta, onde atualmente diz "editado há 18 horas" (mudou para 19 enquanto eu digitava esses comentários). Você pode ver o histórico das edições clicando aqui. A pergunta foi publicada 22 horas atrás (enquanto eu digito isso agora) e, quando você clica no histórico de edições, a pergunta original pode ser vista na parte inferior denominada "1". Sua resposta apareceu cerca de duas horas depois (20 horas atrás), quando era isso que a pergunta ainda dizia. Cerca de uma a duas horas após a sua postagem, o OP editou a pergunta uma vez, o que pode ser visto ...
Glen_b -Reinstate Monica
1
ctd ... no topo do histórico de edições. Há uma janela de dois minutos após cada edição para fazer alterações que contam como parte dessa edição (ou seja, às 22 horas atrás e às 18-19 horas atrás, havia um período de dois minuto cada vez que digamos que um erro de digitação poderia ter sido corrigido), mas ~ 20 horas atrás quando você postou, a pergunta permaneceu inalterada por cerca de duas horas e permaneceu inalterada por mais de uma hora após a postagem, quando uma edição importante ( mostrada no histórico de edições) foi realizada. Quaisquer edições fora dessas breves janelas de pós-edição de dois minutos estariam no histórico de edições.
Glen_b -Reinstala Monica