Por que todas as distribuições conhecidas são unimodais?

13

Não conheço nenhuma distribuição multimodal.

Por que todas as distribuições conhecidas são unimodais? Existe alguma distribuição "famosa" que tenha mais de um modo?

Obviamente, as misturas de distribuições geralmente são multimodais, mas eu gostaria de saber se existem distribuições "sem mistura" que tenham mais de um modo.

Miroslav Sabo
fonte
5
Você está falando de distribuições "padrão", em vez de distribuições "conhecidas".
Stéphane Laurent
12
Que tal beta com ? α=β=0.5
Ameba diz Restabelecer Monica
1
Se você não se importa com distribuições bimodais limitadas , a Wikipedia também menciona a distribuição U-quadratic e arcsine . Acho que esses são apenas casos especiais da distribuição beta ... A Wikipedia também menciona alguns exemplos de ocorrências naturais de distribuições multimodais .
Nick Stauner
12
@ StéphaneLaurent: Eu gosto de "distribuições de nome de marca" , por transmitir que ter sido nomeado não implica em si um status especial para uma distribuição. Distribuições "conhecidas" fazem parecer que o resto pode estar por aí em algum lugar esperando para ser descoberto, como o monstro de Loch-Ness ou a matéria escura.
Scortchi - Restabelecer Monica
5
Excelente @ Scortchi, ótimo vocabulário! Muitos cientistas não matemáticos que encontrei têm a impressão de que não existe uma distribuição sem nome. Talvez haja um fato filosófico mais profundo relacionado por trás disso, a confusão de um nome e da coisa denotada por esse nome (como disse Russell: "A palavra 'cachorro' não se parece com um cachorro")
Stéphane Laurent,

Respostas:

17

A primeira parte da pergunta é respondida em comentários à pergunta: muita "de marca" distribuições são multimodal, tal como qualquer Beta de distribuição com um < 1 e b < 1(a,b)a<1b<1 . Vamos passar para a segunda parte da pergunta.

Todas as distribuições discretas são claramente misturas (de átomos, que são unimodais).

Mostrarei que a maioria das distribuições contínuas também são misturas de distribuições unimodais. A intuição por trás disso é simples: podemos "lixar" os solavancos de um gráfico irregular de um PDF, um por um, até que o gráfico esteja na horizontal. Os solavancos se tornam os componentes da mistura, cada um dos quais é obviamente unimodal.

Consequentemente, exceto talvez por algumas distribuições incomuns cujos PDFs são altamente descontínuos, a resposta para a pergunta é "nenhuma": todas as distribuições multimodais absolutamente contínuas, discretas ou uma combinação dessas duas são misturas de distribuições unimodais.


Considere distribuições contínuas cujos PDFs fFf sejam contínuos (essas são as distribuições "absolutamente contínuas"). (A continuidade não é muito uma limitação; pode ser relaxada ainda mais com uma análise mais cuidadosa, assumindo apenas que os pontos de descontinuidade são discretos.)

Para lidar com "platôs" de valores constantes que podem ocorrer, defina um "modo" como um intervalo (que pode ser um ponto único em que x l = x u ), de modo quem=[xl,xu]xl=xu

  1. tem um valor constante em m , digamos y .fm,y

  2. não é constante em nenhum intervalo que contenha estritamente m .fm

  3. Existe um número positivo tal que o valor máximo de f atingido em [ x l - ϵ , x u + ϵ ] é igual a y .ϵf[xlϵ,xu+ϵ]y

Seja qualquer modo de f . Como f é contínuo, existem intervalos [ x l , x u ] contendo m para os quais f não diminui em [ x l , x l ] (que é um intervalo adequado, não apenas um ponto) e não aumenta em [ x u , x u ]m=[xl,xu]ff[xl,xu]mf[xl,xl][xu,xu](que também é um intervalo adequado). Vamos ser o infinimum de todos esses valores e x ' u o supremo de todos esses valores.xlxu

Essa construção definiu uma "corcunda" no gráfico de estende de x l a x u . Vamos y ser o maior de f ( x ' G ) e f ( x ' u ) . Por construção, o conjunto de pontos x em [ x l , x u ] para o qual f ( x ) y é um intervalo adequado m fxlxuyf(xl)f(xu)x[xl,xu]f(x)ymcontendo estritamente (porque contém todo o conjunto de [ x l , x l ] ou [ x u , x u ] ).m[xl,xl][xu,xu]

Figure

Nesta ilustração de um PDF multimodal, um modo é identificado por um ponto vermelho no eixo horizontal. A extensão horizontal da parte vermelha do preenchimento é o intervalo m : é a base da corcunda determinada pelo modo m . A base dessa corcunda está na altura y = 0,16 . O PDF original é a soma do preenchimento vermelho e do preenchimento azul. Observe que o preenchimento azul possui apenas um modo próximo a 2 ; o modo original em [ 0 , 0 ] foi removido.m=[0,0]mmy0.162[0,0]

escrevendo para o comprimento de m , defina|m|m

pm=PrF(m)y|m|

e

fm(x)=f(x)ypm

quando e f m ( x ) = 0, caso contrário. (Isso torna f m uma função contínua, aliás.) O numerador é a quantidade pela qual f se eleva acima de ye o denominador p m é a área entre o gráfico de f e y . Assim, f m não é negativo e tem a área total 1 : é o PDF de uma distribuição de probabilidade. Por construção, tem um modo único m .xmfm(x)=0fmfypmfyfm1m

Também por construção, a função

fm(x)=f(x)pmfm(x)1pm

é um PDF fornecido . (Obviamente, se p m = 1 , não resta nada de f , que deve ter sido unimodal para começar.) Além disso, ele não possui modos no intervalo m (onde é constante, e é por isso que a cuidadosa definição anterior de necessário como intervalo). Além disso,pm<1pm=1f,m

f(x)=pmfm(x)+(1pm)fm(x)

is a mixture of the unimodal PDF fm and the PDF fm.

fmm=m1,m2,p1=pm,p2=pm2,f1=fm,f2=fm2,. The limiting result exists because (a) the interval where fi is flattened includes a proper interval that had not been flattened in the preceding i1 operations and (b) the real numbers cannot be decomposed into more than a countable number of such intervals. The limit cannot have any modes and therefore is constant, which must be zero (for otherwise its integral would diverge). Consequently, f has been expressed (perhaps not uniquely, because the order in which modes were selected will matter) as a mixture

f(x)=ipifi(x)

of unimodal distributions, QED.

whuber
fonte
7

By unimodal, I think the OP plainly means that there is just one interior mode (i.e. excluding corner solutions). The question is thus really asking ...

why is it that brand name distributions do NOT have more than one interior mode?

i.e. why do most brand name distributions look something like this:

enter image description here

... plus or minus some skewness or some discontinuities? When the question is posed thus, the Beta distribution would not be a valid counter example.

It appears the OP's conjecture has some validity: most common brand name distributions do not allow for more than one interior mode. There may be theoretical reasons for this. For example, any distribution that is a member of the Pearson family (which includes the Beta) will necessarily be (interior) unimodal, as a consequence of the parent differential eqn that defines the entire family. And the Pearson family nests most of the best-known brand names.

Nevertheless, here are some brand name counter examples ...

Counter example

One brand-name counter-example is the Sinc2 distribution with pdf:

f(x)=sin2(x)πx2

defined on the real line. Here is a plot of the Sinc2 pdf:

enter image description here

We could also perhaps add the family of cardiod and distributions related to this class ... with pdf plots such as:

enter image description here

The family of reflected brand name distributions would also perhaps be possible brand name contenders (though, these might be thought of as a 'cheat solution' ... but they are still brand names) such as the Reflected Weibull shown here:

enter image description here

wolfies
fonte
1
My, that plot of Sinc2 sure looks like it has some negative values! (Could that be a plotting artifact?) ... And the cardioid distributions look like they have only one interior mode each.
whuber
1
Hi @whuber ... must agree re the plotting artefact (I will take that up on Mathematica SE !). Re cardiod family: idea is that one can extend the domain of such families as one please, and like a sine wave, it keeps on giving :)
wolfies
1
(+1) It is a strange artifact: your last plot (of reflected distributions) does not seem to exhibit it. You might trace the generation of plot points in the Sinc2 plot to see where they lie; I suspect the slight negative values might be an overshooting of a spline of a small number of points.
whuber
I think it is just because the plotted line is thicker than the axis line, so appears to 'overshoot' the axis when close to zero. If the line is plotted thinner, the artefact disappears.
wolfies
But there is no such artifact in your bottom figure, which also has lines thicker than the axis.
whuber
3

That you mightn't think of any doesn't mean there aren't any.

I can name "known" distributions that aren't unimodal.

For example, a Beta distribution with α and β both <1.

http://en.wikipedia.org/wiki/Beta_distribution

also see

http://en.wikipedia.org/wiki/U-quadratic_distribution

(This isn't a special case of the beta distribution, in spite of the comment that says it is. The two families have some overlap, however.)

Mixture distributions are certainly known, and many of those are multimodal.

Glen_b -Reinstate Monica
fonte
The U-quadratic is a truncated Beta distribution.
becko
1

Alpha-skew-normal distribution (Elal-Olivero 2010) has a PDF:

(1αxμσ)2+12+α2φ(xμσ),

where φ is the PDF of a standard Gaussian.

For |α|>1.34 the distribution is bimodal. Examplary plot for μ=1,σ=0.5,a=2:

enter image description here

corey979
fonte