Sob mistura de duas distribuições normais:
https://en.wikipedia.org/wiki/Multimodal_distribution#Mixture_of_two_normal_distributions
"Uma mistura de duas distribuições normais tem cinco parâmetros para estimar: as duas médias, as duas variações e o parâmetro de mistura. Uma mistura de duas distribuições normais com desvios padrão iguais é bimodal somente se suas médias diferirem pelo menos duas vezes o desvio padrão comum . "
Estou procurando uma derivação ou explicação intuitiva sobre por que isso é verdade. Acredito que possa ser explicado na forma de um teste t de duas amostras:
onde é o desvio padrão combinado.
Respostas:
Esta figura do artigo vinculado nesse artigo da wiki fornece uma boa ilustração:
A prova que eles fornecem é baseada no fato de que as distribuições normais são côncavas dentro de um DP de sua média (o DP é o ponto de inflexão do pdf normal, de onde ele vai de côncavo a convexo). Assim, se você adicionar dois PDFs normais (em proporções iguais), desde que suas médias diferam em menos de dois DPs, a soma-pdf (ou seja, a mistura) será côncava na região entre os dois meios e, portanto, o máximo global deve estar no ponto exatamente entre as duas médias.
Referência: Schilling, MF, Watkins, AE, & Watkins, W. (2002). A altura humana é bimodal? The American Statistician, 56 (3), 223-229. doi: 10.1198 / 00031300265
fonte
É um caso em que as imagens podem enganar, porque esse resultado é uma característica especial das misturas normais : um analógico não se aplica necessariamente a outras misturas, mesmo quando os componentes são distribuições unimodais simétricas! Por exemplo, uma mistura igual de duas distribuições de Student t separadas por um pouco menos que o dobro do seu desvio padrão comum será bimodal. Para uma percepção real, precisamos fazer algumas contas ou apelar para propriedades especiais das distribuições normais.
Escolher as unidades de medição (por recentragem e rescaling conforme necessário) para colocar os meios das distribuições dos componentes em±μ, μ≥0, e para fazer a sua unidade variância comum. Seja p, 0<p<1, a quantidade do componente médio maior na mistura. Isso nos permite expressar a densidade da mistura em plena generalidade como
Como as densidades de ambos os componentes aumentam ondex<−μ e diminuem onde x>μ, os únicos modos possíveis ocorrem onde −μ≤x≤μ. Encontre-os diferenciando f em relação a x e configurando-o para zero. Limpando quaisquer coeficientes positivos obtidos
Isso é logicamente equivalente à afirmação na pergunta.
fonte
Comentário acima colado aqui para continuidade:
Comentário continuado:
Código R para a figura:
fonte