Kurtosis de distribuição inventada

8

Dê uma olhada na imagem abaixo. A linha azul indica o pdf normal padrão. Supõe-se que a zona vermelha seja igual à soma das áreas cinzentas (desculpe pelo desenho horrível).

Será que podemos criar uma nova distribuição com pico mais alto deslocando as zonas cinzas para o topo (zona vermelha) do pdf normal?

nova distribuição com pico mais alto

Se essa transformação pode ser feita, o que você acha da curtose dessa nova distribuição? Leptokurtic? Mas tem as mesmas caudas que a distribuição normal! Indefinido?

Yal dc
fonte
1
A pergunta é bonita, mas o desenho é realmente horrível. A distribuição kurtic mais nítida do que o normal deve ser de cauda mais pesada. Mas você não desenhou essas regiões da cauda (que também devem ter a cor vermelha). Quais são as áreas que você supõe adicionar?
ttnphns
1
Por que não tentar? Simule (digamos) 10.000 a partir de um normal padrão e mova alguns números para fazer a distribuição que você deseja. Então você pode desenhar a linha com um programa e calcular a curtose também.
Peter Flom
Se você estiver preparado para sacrificar a diferenciabilidade da densidade, poderá construir uma distribuição desse tipo (que teria uma densidade por partes).
Alecos Papadopoulos
2
@ttnphns, desculpe se a tag enganou você. Eu esperava que essa foto deixasse claro que eu não quero nenhuma mudança na cauda. Geralmente, os livros discutem a curtose comparando a mudança simultânea no pico e nas caudas. Quero entender o que se pode dizer sobre a curtose quando apenas o pico se torna mais alto.
Yal dc
1
Yal dc - você deve observar que seu desvio padrão mudou, portanto os 'rabos' não são os mesmos, a menos que você use algumas definições específicas detail
Glen_b -Reinstate Monica

Respostas:

12

Haverá um número infinito de distribuições que se parecem muito com o seu desenho, com uma variedade de valores diferentes para a curtose.

Com as condições particulares da sua pergunta e considerando que mantemos o ponto de cruzamento dentro, ou pelo menos não muito longe±1 , deve ocorrer uma curtose ligeiramente maior do que a normal. Mostrarei três casos em que isso acontece e depois mostrarei um em que é menor - e explicarei o que faz com que isso aconteça.

Dado que e são os pdf e cdf normais padrão, respectivamente, vamos escrever uma pequena funçãoΦ ( x )ϕ(x)Φ(x)

f(x)={ϕ(x);|x|>ta+b.g(x);|x|t 

para alguma densidade simétrica contínua (com o cdf correspondente ), com média , tal que e .G 0gG0b=Φ(t)½t.ϕ(t)G(t)½t.g(t)a=ϕ(t)b.g(t)

Ou seja, e são escolhidos para fazer a densidade contínua e integrar a .ab1

Exemplo 1 Consideree,g(x)=3ϕ(3x)t=1

insira a descrição da imagem aqui

que se parece com o seu desenho, gerado aqui pelo seguinte código R:

f <- function(x, t=1,
              dg=function(x) 2*dnorm(2*x),
              pg=function(x) pnorm(2*x),
              b=(pnorm(t) - 0.5 - t*dnorm(t))/ (pg(t) - 0.5 - t*dg(t)),
              a=dnorm(t)-b*dg(t) ) {
       ifelse(abs(x)>t,dnorm(x),a+b*dg(x))
     }

f1 <- function(x) f(x,t=1,dg=function(x) 3*dnorm(3*x),pg=function(x) pnorm(3*x))
curve(f1,-4,4,col=2)
lines(x,dnorm(x),col=3)

Agora os cálculos. Vamos criar uma função para avaliar :xpf1(x)

fp <- function(x,p=2) x^p*f1(x)

para que possamos avaliar os momentos. Primeiro a variação:

 integrate(fp,-Inf,Inf)  # should be just smaller than 1
0.9828341 with absolute error < 1.4e-07

Em seguida, o quarto momento central:

 integrate(fp,-Inf,Inf,p=4) # should be just smaller than 3
2.990153 with absolute error < 8.3e-06

Precisamos da proporção desses números, que devem ter cerca de 5 dígitos de precisão

 integrate(fp,-Inf,Inf,p=4)$value/(integrate(fp,-Inf,Inf)$value^2)
[1] 3.095515

Portanto, a curtose é de cerca de 3,0955, um pouco maior do que no caso normal.

É claro que poderíamos calculá-lo algebricamente e obter uma resposta exata, mas não há necessidade, isso nos diz o que queremos saber.


Exemplo 2 Com a funçãodefinida acima, podemos tentar para todos os tipos de's.fg

Aqui está o Laplace:

library(distr)
D <- DExp(rate = 1) 
f2 <- function(x) f(x,t=1,dg=d(D),pg=p(D))
curve(f2,-4,4,col=2)
lines(x,dnorm(x),col=3)

insira a descrição da imagem aqui

fp2 <- function(x,p=2) x^p*f2(x)


 integrate(fp2,-Inf,Inf)  # should be just smaller than 1
0.9911295 with absolute error < 1.1e-07
 integrate(fp2,-Inf,Inf,p=4) # should be just smaller than 3
2.995212 with absolute error < 5.9e-06
 integrate(fp2,-Inf,Inf,p=4)$value/(integrate(fp2,-Inf,Inf)$value^2)
[1] 3.049065

Sem surpresa, um resultado semelhante.


Exemplo 3 : Vamos considerarcomo uma distribuição Cauchy (uma distribuição Student-t com 1 df), mas com a escala 2/3 (ou seja, sefor um Cauchy padrão,e, novamente, defina o limite, t (fornecendo os pontos,, fora do qual 'alternamos' para o normal), como 1.gh(x)g(x)=1.5h(1.5x)±t

dg <- function(x) 1.5*dt(1.5*x,df=1)
pg <- function(x) pt(1.5*x,df=1)

f3 <- function(x) f(x,t=1,dg=dg,pg=pg)
curve(f3,-4,4,col=2)
lines(x,dnorm(x),col=3)

insira a descrição da imagem aqui

fp3 <- function(x,p=2) x^p*f3(x)

 integrate(fp3,-Inf,Inf)  # should be just smaller than 1
0.9915525 with absolute error < 1.1e-07

 integrate(fp3,-Inf,Inf,p=4) # should be just smaller than 3
2.995066 with absolute error < 6.2e-06

 integrate(fp3,-Inf,Inf,p=4)$value/(integrate(fp2,-Inf,Inf)$value^2)
[1] 3.048917

E apenas para demonstrar que realmente temos uma densidade adequada:

 integrate(f3,-Inf,Inf)
1 with absolute error < 9.4e-05

Exemplo 4 : No entanto , o que acontece quando alteramos t ?

Tome e como o exemplo anterior, mas altere o limite para :gGt=2

f4 <- function(x) f(x,t=2,dg=dg,pg=pg)
curve(f4,-4,4,col=2)
lines(x,dnorm(x),col=3)

insira a descrição da imagem aqui

fp4 <- function(x,p=2) x^p*f4(x)

 integrate(fp4,-Inf,Inf,p=4)$value/(integrate(fp2,-Inf,Inf)$value^2)
[1] 2.755231

Como isso acontece?

Bem, é importante saber que a curtose é (falando levemente) 1 + a variação quadrada de :μ±σ

insira a descrição da imagem aqui

Todas as três distribuições têm a mesma média e variação.

A curva preta é a densidade normal padrão. A curva verde mostra uma distribuição bastante concentrada sobre (ou seja, a variação sobre é pequena, levando a uma curtose que se aproxima de 1, a menor possível). A curva vermelha mostra um caso em que a distribuição é "afastada" de ; isto é, a curtose é grande.μ±σμ±σμ±σ

Com isso em mente, se definirmos os pontos de limiar longe o suficiente fora de , podemos empurrar a curtose abaixo de 3 e ainda ter um pico mais alto.μ±σ

Glen_b -Reinstate Monica
fonte
Ótimo trabalho. Obrigado. Mais uma pergunta, se você não se importa: existe alguma regra para decidir onde um pico termina e onde as caudas começam?
amigos estão dizendo
1
Na verdade não. Se nos restringirmos ao caso unimodal simétrico contínuo com o 4º momento finito (já que estamos discutindo a curtose), em muitos casos, não acho que faça muito sentido chamar algo fora de "pico" nem qualquer coisa dentro 'the tail', mas às vezes é difícil dizer. por exemplo, considere ; quando está perto de , não há um lugar óbvio para começar a chamá-lo de rabo. Por outro lado, com a distribuição de Laplace, você poderia chamar qualquer coisa de qualquer lado do centro exato da cauda. μ±σ μ±σf(x)=(3+2a)/6ax2; 1<x<1,0<a<34a0
Glen_b -Reinstate Monica
4

A curtose é um conceito bastante incompreendido (acho o artigo de LT De Carlo "Sobre o significado e o uso da curtose" (1997) uma discussão e apresentação sensata e valiosa das questões envolvidas).

Então, a visão ingênua e construirei uma densidade, , com "valor médio e superior mais fino no modo", em comparação com a densidade normal padrão, mas "caudas" idênticas à última. Eu não afirmam que este exposições de densidade "excesso de curtose". gX(x)

Essa densidade será necessariamente passo a passo. Para ter "caudas" esquerda e direita idênticas, sua forma funcional para os intervalos e , onde , deve ser idêntica à normal normal densidade. No intervalo do meio, , ele deve ter alguma outra forma funcional, chamada . Esse deve ser simétrico em torno de zero e satisfazer (,a)(a,)a>0ϕ(x)(a,a)h(x)h(x)

1) para que o valor da densidade no modo seja maior que o valor da normal padrão e h(0)>ϕ(0)=1/2π

2) modo que seja contínuo. ϕ(a)=h(a)=h(a)=ϕ(a)gX(x)

, o deve integrar-se à unidade sobre o domínio, a fim de ter uma densidade adequada. Então essa densidade serágX(x)

gX(x)=ϕ(x)<xah(x)axaϕ(x)ax<

sujeito às restrições mencionadas anteriormente sobre e também, sujeito a h(x)

aϕ(t)dt+aah(t)dt+aϕ(t)dt=1

que é equivalente a exigir que a massa de probabilidade abaixo de no intervalo seja igual à massa de probabilidade sob no mesmo intervalo:h(x)(a,a)ϕ(x)

aa(h(t)ϕ(t))dt=00a(h(t)ϕ(t))dt=0
a última parte devido às propriedades de simetria.

Para obter algo específico, "tentaremos" a densidade da distribuição de Laplace com média zero parah(x)

h(x)=12be|x|b,b>0

Para satisfazer os vários requisitos definidos anteriormente, devemos ter:

Para um valor mais alto no modo,

h(0)=12b>ϕ(0)=12π0<b<π/2[1]

Para continuidade,

h(a)=ϕ(a)12beab=12πe12a2
ln(2b)ab=ln(2π)12a212a2ab+lnπ/2b

Este é um quadrático em . Seu discriminante é a

Δa=1b2412lnπ/2b>0

(pode ser facilmente verificado que é sempre positivo). Além disso, mantemos apenas a raiz positiva, pois éa>0

a=1b+Δa[2]

Finalmente, o requisito para a densidade se integrar à unidade se traduz em

0a12be|x|bdt=0aϕ(t)dt

que por integração direta leva a

1eab=2(Φ(a)12)=erf(a/2)[3]

que pode ser resolvido numericamente para , e assim determinar completamente a densidade que buscamos. b

É claro que outras formas funcionais simétricas em torno de zero poderiam ser tentadas, o pdf laplaciano era apenas para fins de exposição.

Alecos Papadopoulos
fonte
1
Achei o artigo que você mencionou muito informativo. Obrigado.
Yal dc
1
Uma ressalva sobre o artigo de DeCarlo: A primeira frase do resumo é matematicamente incorreta. Ele afirma: "Para distribuições unimodais simétricas, a curtose positiva indica caudas pesadas e pico em relação à distribuição normal, enquanto a curtose negativa indica caudas leves e planas". Mas existem distribuições unimodais simétricas com excesso de curtose negativa que possuem picos infinitos, e há distribuições unimodais simétricas com curtose infinita que têm picos perfeitamente planos.
quer
0

A curtose dessa distribuição provavelmente será maior que a de uma distribuição normal. Digo provavelmente porque estou baseando isso em um desenho aproximado e, embora possa ser possível provar que a massa em movimento dessa maneira sempre aumenta a curtose, não sou positivo sobre isso.

Embora seja verdade que possui as mesmas caudas que uma distribuição normal, essa distribuição terá uma variação menor do que a distribuição normal da qual é derivada. O que significa que suas caudas corresponderão às caudas de alguma distribuição normal, mas não de uma distribuição normal com a mesma variação que ela. Portanto, as caudas normalizadas serão de fato mais grossas que as caudas de uma distribuição normal. E, embora caudas mais grossas não signifiquem automaticamente mais curtose, nesse caso o quarto momento normalizado provavelmente também será maior.

mpr
fonte
Concordo que a variação será menor. Infelizmente, eu não entendi como a mudança na variação influencia as caudas? Lembre-se, que eu não fiz nada na cauda. Os pontos deslocados foram tirados perto do pico, não pelas caudas. Poderia me ajudar a entender o seu ponto?
Yal dc
1
A curtose é definida em termos do quarto momento normalizado, em que a normalização é realizada dividindo pelo quadrado da variância. Como o quadrado da variância diminui, a curtose aumenta. Em termos de caudas, é verdade que eles não mudam. No entanto, como a variação diminuiu, para obter a comparação correta, você precisa comparar sua distribuição com uma distribuição normal que tenha a mesma variação que a sua. Essa outra distribuição normal terá caudas mais finas, porque sua variação é menor.
Mpr27 /
Nesse caso, eu concordo. A questão que resta é como você determinou o que é " a comparação correta "? É uma regra que devemos usar distribuições com variação semelhante para comparar suas outras propriedades? Eu nunca conheci esse princípio antes.
Yal dc
1
A variação é a maneira padrão de normalizar distribuições. Você perguntou especificamente sobre a curtose, e como eu disse, a curtose é definida com base no quarto momento normalizado, o que significa que se você estiver interessado em comparar a curtose, sim, deve comparar as distribuições com a mesma variação.
Mpr2
Agora eu entendo. De fato, qualquer distribuição normal tem curtose constante, enquanto sua variação pode ser diferente. Obrigado pelo esclarecimento.
Yal dc
0

Parece que o OP está tentando estabelecer uma conexão entre "pico" e curtose, mantendo as caudas fixas e tornando a distribuição mais "alta". Há um efeito na curtose aqui, mas é tão leve que dificilmente vale a pena mencionar. Aqui está um teorema para apoiar essa afirmação.

Teorema 1: Considere qualquer distribuição de probabilidade com quarto momento finito. Construa uma nova distribuição de probabilidade substituindo a massa no intervalo , mantendo a massa fora de fixa e mantendo a média e desvio padrão em . Então, a diferença entre os valores mínimo e máximo da curtose do momento de Pearson em todas essas substituições é de .[μσ,μ+σ][μσ,μ+σ]μ,σ0.25

Comentário: A prova é construtiva; você pode realmente identificar as substituições de curtose mínima e máxima nessa configuração. Além disso, 0,25 é um limite superior na faixa de curtose, dependendo da distribuição. Por exemplo, com uma distribuição normal, o limite do intervalo é 0,141, em vez de 0,25.

Por outro lado, há um enorme efeito das caudas na curtose, como é dado pelo seguinte teorema:

Teorema 2: Considere qualquer distribuição de probabilidade com quarto momento finito. Construa uma nova distribuição de probabilidade substituindo a massa fora do intervalo , mantendo a massa em fixa e mantendo a média e desvio padrão em . Então, a diferença entre os valores mínimo e máximo da curtose do momento de Pearson sobre todas essas substituições é ilimitada; ou seja, a nova distribuição pode ser escolhida para que a curtose seja aribitrariamente grande.[μσ,μ+σ][μσ,μ+σ]μ,σ

Comentário: Esses dois teoremas mostram que o efeito das caudas na curtose do momento de Pearson é infinito, enquanto o efeito de "pico" é de .0.25

Peter Westfall
fonte