Alguém pode oferecer um exemplo de distribuição unimodal que tem uma assimetria zero, mas que não é simétrica?

31

Em maio de 2010, o usuário da Wikipedia Mcorazao acrescentou uma frase ao artigo de assimetria que "Um valor zero indica que os valores estão distribuídos de maneira relativamente uniforme nos dois lados da média, tipicamente mas não necessariamente implicando uma distribuição simétrica". No entanto, a página wiki não possui exemplos reais de distribuições que violem essa regra. Buscar no Google "exemplos de distribuições assimétricas com assimetria zero" também não fornece exemplos reais, pelo menos nos 20 primeiros resultados.

Usando a definição de que a inclinação é calculada por e R FórmulaE[(Xμσ)3]

sum((x-mean(x))^3)/(length(x) * sd(x)^3)

Eu posso construir uma distribuição pequena e arbitrária para diminuir a assimetria. Por exemplo, a distribuição

x = c(1, 3.122, 5, 4, 1.1) 

gera uma inclinação de . Mas esta é uma amostra pequena e, além disso, o desvio da simetria não é grande. Então, é possível construir uma distribuição maior com um pico altamente assimétrico, mas ainda assim com uma assimetria de quase zero?5.64947105

Andy McKenzie
fonte
3
Deseja que a distribuição seja unimodal ou não? O título diz isso, mas o texto mal menciona esse ponto.
Dilip Sarwate
@Dilip Sim, eu acharia mais interessante se a distribuição fosse unimodal, já que a distorção, como um momento central, não faz muito sentido.
Andy McKenzie

Respostas:

28

Considere distribuições discretas. Um que é suportado nos valores de x 1 , x 2 , , x k é determinado por probabilidades não-negativas p 1 , p 2 , , p k sujeito às condições que (a) somam a 1 e (b) o coeficiente de assimetria é igual a 0 (o que equivale ao terceiro momento central sendo zero). Isso deixa k - 2 graus de liberdade (no sentido de resolver equações, não no estatístico!). Podemos esperar encontrar soluções unimodais.kx1,x2,,xkp1,p2,,pkk2

Para facilitar a busca de exemplos, procurei soluções suportadas em um pequeno vetor simétrico com um modo único em 0 , média zero e assimetria zero . Uma dessas soluções é ( p 1 , , p 7 ) = ( 1396 , 3286 , 9586 , 47386 , 8781 , 3930 ,x=(3,2,1,0,1,2,3)0 .(p1,,p7)=(1396,3286,9586,47386,8781,3930,1235)/75600

Função de probabilidade

Você pode ver que é assimétrico.

Aqui está uma solução mais obviamente assimétrica com (que é assimétrico) ep = ( 1 , 18 , 72 , 13 , 4 ) / 108 :x=(3,1,0,1,2)p=(1,18,72,13,4)/108

Função de probabilidade 2

Agora é óbvio o que está acontecendo: como a média é igual a , os valores negativos contribuem ( - 3 ) 3 = - 27 e 18 × ( - 1 ) 3 = - 18 para o terceiro momento, enquanto os valores positivos contribuem 4 × 2 3 = 32 e 13 × 1 3 = 13 , equilibrando exatamente as contribuições negativas. Podemos pegar uma distribuição simétrica em torno de 0 , como x =0(3)3=2718×(1)3=184×23=3213×13=130 com p = ( 1 , 4 , 1 ) / 6 , e deslocar um pouco de massa a partir de + 1 a + 2 , uma pequena massa de + 1 até - 1 , e uma pequena quantidade de massa até - 3 , mantendo a média em 0 e a assimetria em 0x=(1,0,1)p=(1,4,1)/6+1+2+11300também, ao criar uma assimetria. A mesma abordagem funcionará para manter a média zero e a assimetria zero de uma distribuição contínua, tornando-a assimétrica; se não formos muito agressivos com a mudança de massa, ela permanecerá unimodal.


Editar: Distribuições Contínuas

Como o problema continua aparecendo, vamos dar um exemplo explícito com distribuições contínuas. Peter Flom teve uma boa ideia: veja as misturas de normais. Uma mistura de duas normais não serve: quando sua distorção desaparece, será simétrica. O próximo caso mais simples é uma mistura de três normais.

As misturas de três normais, após uma escolha apropriada de local e escala, dependem de seis parâmetros reais e, portanto, devem ter flexibilidade mais que suficiente para produzir uma solução assimétrica e assimetria zero. Para encontrar alguns, precisamos saber como calcular assimetrias de misturas de normais. Entre estes, procuraremos por qualquer que seja unimodal (é possível que não haja nenhum).

rthr2r/2Γ(1r2)/πσrthσrμrthr

(μ,σ)(0,1)(1/2,1)(0,127/18)(0,2.65623)(0+1/2+0)/3=1/60.05192161/6

Exemplos contínuos

Os gráficos indicam que estes são unimodais. (Você pode verificar usando Cálculo para encontrar máximos locais.)

whuber
fonte
(+1) Resposta muito esperta. Isso funcionará com distribuições contínuas? A mudança não criaria modos minúsculos? Eu não pode estar pensando em linha reta ...
Macro
1
Você está pensando muito bem, Macro: todos devemos ser tão céticos. O truque é mudar pequenas quantidades espalhadas por amplas faixas. Um teste de primeira derivada permitirá que você verifique possíveis modos e também forneça a base para uma prova de que mudanças suficientemente pequenas desse formulário não produzirão novos modos.
whuber
Obrigado pela resposta! Isso é semelhante ao que eu pensava intuitivamente, embora não pudesse expressar bem as palavras - que você precisa "equilibrar" a massa de cada lado da distribuição. Me faz pensar se existem maneiras estereotipadas pelas quais alguém pode executar esse ato de equilíbrio.
Andy McKenzie
Uma maneira, Andy, é começar com uma solução discreta e envolvê-la em uma distribuição normal. Nesse caso, o requisito de unimodalidade forçará a distribuição normal a ter um grande desvio padrão. Mesmo assim, se a convolução não alterar apreciavelmente as propriedades necessárias (como assimetria zero) ou alterá-la de maneira previsível, você terá um controle matemático do problema. Em certo sentido, minha edição recente pode ser vista como um ataque, embora não seja estritamente uma convolução (porque os três normais têm desvios padrão diferentes).
whuber
2
Eu verifiquei, Andy: convencer a solução discreta com uma distribuição normal não altera a assimetria. Quando você atribui a essa distribuição normal um desvio padrão em torno de 0,57 ou superior, o resultado é unimodal. Como a distribuição discreta subjacente, ela continua com média zero, assimetria zero e é assimétrica. Misturar isso com uma distribuição normal padrão equivale a um movimento controlado de massa entre a distribuição normal padrão e a distribuição discreta: isso pode atender à sua solicitação de um método "estereotipado".
whuber
23

k=0.0629c=18.1484

g(x)=ckx(c+1)[1+xc](k+1)

Tem média 0,5387, desvio padrão 0,2907, assimetria 0,0000 e curtose 2,0000. A fonte também chama isso de "distribuição de elefantes": insira a descrição da imagem aqui

Minha reprodução em R foi criada com

library(actuar)
library(knotR)

# a nonsymmetric distribution with zero skewness
# see https://www.qualitydigest.com/inside/quality-insider-article/problems-skewness-and-kurtosis-part-one.html#

c <- 18.1484
k <- 0.0629

x <- seq(0,1.5,by=.0001)

elephant.density <- dinvburr(x, k, c)
plot(x,elephant.density, type="l")
polygon(c(min(x),x),c(min(elephant.density),elephant.density), col="grey")
points(0.8,0.8, pch=19, cex=2)

# "ears" created via https://www.desmos.com/calculator/cahqdxeshd
ear.x <- c(0.686, 0.501, 0.42, 0.68)
ear.y <- c(0.698, 0.315, 1.095, 0.983)

myseg(bezier(cbind(ear.x, ear.y)), type="l")

EX <- gamma(k+1/c)*gamma(1-1/c)/gamma(k) # see p6 of https://wwz.unibas.ch/uploads/tx_x4epublication/23_07.pdf
EX2 <- gamma(k+2/c)*gamma(1-2/c)/gamma(k)
EX3 <- gamma(k+3/c)*gamma(1-3/c)/gamma(k)
(skewness <- (EX3 - 3*EX*(EX2-EX^2)-EX^3)/(EX2-EX^2)^(3/2)) # zero to three digits: 0.0003756196

kc

   # optimize skewness a bit further
    skewval <- 1

while (skewval > 10^(-10)){
  optskew.k <- uniroot(skewness.fun, lower = k*.95, upper = k*1.1, tol=skewval^2, c=c)
  skewval <- optskew.k$f.root
  k <- optskew.k$root

  optskew.c <- uniroot(skewness.fun, lower = c*.95, upper = c*1.1, tol=skewval^2, k=k)
  skewval <- optskew.c$f.root
  c <- optskew.c$root
}

produzindo

> print(c)
[1] 18.89306

> print(k)
[1] 0.05975542

> print(skewval)
[1] -1.131464e-15
Christoph Hanck
fonte
Obrigado pela edição. Dito isto, não foi possível reproduzir a assimetria de 0,0000 a quatro dígitos, obtendo 0,0001245138 (veja a próxima edição, no código R).
Christoph Hanck
ck
Na verdade, 0.0003756196. 0.0001245138 já estava após alguma otimização inicial, fornecida aqui por engano. Vou dar uma olhada.
Christoph Hanck
@amoeba, tentei otimizar um pouco, mas não afirmo ter feito isso de maneira inteligente, tenho pouca experiência com otimização.
Christoph Hanck
2
A inclinação de zero a três dígitos (quase quatro) era suficiente para mim; não é que um valor mais preciso faça com que pareça diferente. Se a distorção cruzar o zero nessa vizinhança e for claro em quais direções ajustar os valores, se for necessária mais precisão, acho que isso é suficiente. Mas parabéns pelo esforço adicional. (É um belo exemplo, pela maneira.)
Glen_b -Reinstate Monica
9

Considere uma distribuição na metade positiva da linha real que aumenta linearmente de 0 para o modo e é exponencial à direita do modo, mas é contínua no modo.

Isso poderia ser chamado de distribuição triangular-exponencial (embora muitas vezes pareça um pouco com uma barbatana de tubarão).

θλ

λθλθ6.15

Triangular-Exponencial com assimetria zero

[1][2]

O segmento Distribuições não normais com assimetria zero e excesso de curtose? tem alguns exemplos assimétricos, incluindo um pequeno exemplo discreto e outro contínuo e unimodal:

Mistura Gaussiana unimodal com assimetria zero

Distribuições unimodais discretas - ou equivalentemente, amostras - com assimetria zero são bastante fáceis de construir, de tamanho grande ou pequeno.

Aqui está um exemplo, que você pode tratar como uma amostra ou (dividindo as frequências brutas por 3000) como um pmf (os valores 'x' são os valores obtidos, 'n' é o número de vezes que esse valor ocorre na amostra ):

x:  -2   -1    0    1    2    3    4    5    6    7    8    9   10
n: 496  498  562 1434    2    1    1    1    1    1    1    1    1

Um gráfico da função de massa de probabilidade construída a partir do acima

Este exemplo é construído a partir de distribuições de 3 pontos:

x:          -2              1                  c
n:   c(c-1)(c+1)/6     c(c-1)(c+1)/3 - c       1

ccinixi=0inixi3=0c

Existem todos os tipos de outros "átomos" que se pode construir, mas este exemplo usa apenas esse tipo. A alguma combinação de átomos como esses são adicionados alguns valores simetricamente colocados para preencher os buracos restantes e garantir a unimodalidade sem destruir a estrutura da média e do terceiro momento.

[1]


[2]


Glen_b -Reinstate Monica
fonte
3
Talvez pudesse chamá-lo de "barbatana de tubarão", talvez?
Glen_b -Reinstar Monica
@Glen_b Totalmente barbatana de tubarão, de fato.
Alecos Papadopoulos
2

Certo. Tente o seguinte:

skew= function (x, na.rm = FALSE) 
 {
    if (na.rm)    x <- x[!is.na(x)]             #remove missing values
    sum((x - mean(x))^3)/(length(x) * sd(x)^3)  #calculate skew   
 }

set.seed(12929883) 
x = c(rnorm(100, 1, .1), rnorm(100, 3.122, .1), rnorm(100,5, .1), rnorm(100, 4, .1), rnorm(100,1.1, .1))

 skew(x)
 plot(density(x))

(Você já fez as coisas difíceis!)

Peter Flom - Restabelece Monica
fonte
1
Bom, eu gosto disso. +1
gung - Reinstate Monica
4
Não é bimodal ... é terrivelmente vários -modal. Tente plotar a densidade; curve(0.2*(dnorm(x, 1, .1) + dnorm(x, 3.122, .1) + dnorm(x, 5, .1) + dnorm(x, 4, .1) + dnorm(x, 1.1, .1)), 0,10)
guest
1
Os dados gerados dessa maneira certamente não são unimodais. Tudo o que você precisa fazer é ver e recortar e colar seu código, literalmente. De fato, uma mistura de variáveis ​​normalmente distribuídas nunca será unimodal (a menos que, é claro, uma das proporções da mistura seja 1).
Macro
8
@ Macro, isso não está correto. Veja, por exemplo, o resumo de Roeder 1994 (JASA) para o resultado bem conhecido de que "a densidade de duas normais misturadas não é bimodal, a menos que os meios sejam separados por pelo menos 2 desvios padrão". Se eles são separados por menos que isso, a mistura é unimodal.
guest
1
Você está certo @ convidado. Eu tinha esquecido essa possibilidade quando eu fiz o meu post
Macro
2

E[(Xμσ)3]=0
E[(Xμσ)3|Xμ]+E[(Xμσ)3|X>μ]=0.

YZμ

E[(Yμσ)3]=E[(Zμσ)3]
XYμ(μZ)

YZμμ

krlmlr
fonte
1
Como você garante que a distribuição é unimodal?
precisa
YZμ
σYZ
@whuber: Droga. Eu sabia que tinha que haver alguma armadilha ... :-)
krlmlr
2

A seguinte distribuição discreta é assimétrica e tem assimetria nula: Prob (-4) = 1/3, Prob (1) = 1/2, Prob (5) = 1/6. Encontrei no artigo de Doric et al., Qual Quant (2009) 43: 481-493; DOI 10.1007 / s11135-007-9128-9

Petitjean
fonte
+1 Faz check-out e é unimodal. Esse é o exemplo mais simples possível.
whuber