Este artigo está acima da minha liga, mas fala sobre um tópico no qual estou interessado, a relação entre média, moda e mediana. Diz :
Acredita-se amplamente que a mediana de uma distribuição unimodal é "geralmente" entre a média e o modo. No entanto, isso nem sempre é verdade...
Minha pergunta : alguém pode fornecer exemplos de distribuições unimodais contínuas (idealmente simples) onde a mediana está fora do intervalo [mode, mean]? Por exemplo, uma distribuição como mode < mean < median
.
=== EDIT =======
Já existem boas respostas de Glen_b e Francis, mas percebi que o que realmente me interessa é um exemplo em que modo <média <mediana ou mediana <média <modo (que é a mediana está fora de [mode, mean] E a mediana é "do mesmo lado" como média do modo (ou seja, modo acima ou abaixo)). Posso aceitar as respostas aqui, abrir uma nova pergunta ou talvez alguém possa sugerir uma solução aqui diretamente?
Respostas:
Claro, não é difícil encontrar exemplos - mesmo os unimodais contínuos - em que a mediana não está entre a média e o modo.
Considere iid a partir de uma distribuição triangular no formatof T ( t ) = 2 ( 1 - t ) 1 0 < t < 1T1, T2 fT( t ) = 2 ( 1 - t ) 10 < t < 1
Agora seja uma mistura 60-40 de e .T 1 - 4 t 2X T1 −4T2
A densidade do é assim:X
A média está abaixo de 0, o modo está em 0, mas a mediana está acima de 0. Uma pequena modificação disso daria um exemplo em que até a densidade (e não apenas o cdf) era contínua, mas a relação entre medidas de localização era o mesmo (editar: veja 3. abaixo).
Generalizando, vamos colocar uma proporção (com ) da probabilidade total no triângulo do lado direito e uma proporção no triângulo do lado esquerdo (no lugar dos 0,6 e 0,4 nós tínhamos antes). Além disso, faça o fator de escala na metade esquerda vez de (com ):0 < p < 1 ( 1 - p ) - β - 4 β > 0p 0<p<1 (1−p) −β −4 β>0
Agora, assumindo , a mediana sempre estará no intervalo coberto pelo triângulo retângulo; portanto, a mediana excederá o modo (que sempre permanecerá em ). Em particular, quando , a mediana estará em . 0p>1p>12 0 1-1/√p>12 1−1/2p−−√
A média será em .(p−β(1−p))/3
Se , a média estará abaixo do modo e, se a média estará acima do modo.β>p/(1−p) β<p/(1−p)
Por outro lado, queremos que mantenha a média abaixo da mediana.(p−β(1−p))/3<1−1/2p−−√
Considere ; isso coloca a mediana acima do modo.p=0.7
Então satisfaria portanto a média está acima do modo.β=2 β<p/(1−p)
A mediana está atualmente em enquanto a média está em . Portanto, para e , temos modo <média <mediana.1−1/1.4−−−√≈0.1548 0.7−2(0.3)3≈0.0333 p=0.7 β=2
(Nota: para consistência com a minha notação, a variável no eixo x para ambas as plotagens deve ser vez de mas não vou voltar e corrigi-la.)x t
Este é um exemplo em que a densidade em si é contínua. É baseado na abordagem em 1. e 2. acima, mas com o "salto" substituído por uma ladeira íngreme (e, em seguida, toda a densidade caiu cerca de 0 porque eu quero um exemplo que pareça inclinado à direita).
[Usando a abordagem "mistura de densidades triangulares", ela pode ser gerada como uma mistura de 3 variáveis independentes da forma triangular descrita na seção 1. Temos agora 15% , 60% e 25% .]T1 −3T2 5T3
Como podemos ver no diagrama acima, a média está no meio, conforme solicitado.
Observe que m_t_ menciona o Weibull nos comentários (para os quais a mediana está fora do intervalo para um pequeno intervalo do parâmetro de forma ). Isso é potencialmente satisfatório porque é uma distribuição contínua (e suave) unimodal bem conhecida com forma funcional simples.k[mode,mean] k
Em particular, para valores pequenos do parâmetro de forma Weibull, a distribuição é inclinada para a direita e temos a situação usual de mediana entre o modo e a média, enquanto que para valores grandes do parâmetro de forma Weibull, a distribuição é inclinada para a esquerda , e novamente temos a situação "mediana no meio" (mas agora com o modo à direita e não à média). Entre esses casos, há uma pequena região onde a mediana está fora do intervalo do modo médio e, no meio disso, a média e o modo passam:
Escolhendo valores convenientes para o parâmetro shape nos intervalos marcados (1) e (2) acima - aqueles em que as diferenças entre as estatísticas de localização são quase iguais - obtemos:
Embora atendam aos requisitos, infelizmente os três parâmetros de localização estão tão próximos que não podemos distingui-los visualmente (todos caem no mesmo pixel), o que é um pouco decepcionante - os casos dos meus exemplos anteriores são muito mais separados. (No entanto, sugere situações a serem examinadas com outras distribuições, algumas das quais podem fornecer resultados visualmente mais distintos.)
fonte
O exemplo a seguir é retirado dos Contra- exemplos de Probabilidade de Jordan Stoyanov .
fonte
Tome a distribuição exponencial com o parâmetro de taxa ae densidade a exp (-ax) para 0 <= x <infinito. O modo está em zero. Obviamente, a média e a mediana são maiores que 0. O cdf é 1-exp (-ax). Portanto, para a mediana resolva para exp (-ax) = 0,5 para x. Então -ax = ln (0,5) ou x = -ln (0,5) / a. Para a média, integre ax exp (-ax) de 0 ao infinito. Tome a = 1 e temos uma mediana = -ln (0,5) = ln (2) e média = 1.
Então modo <mediana <média.
fonte