Dê uma olhada na imagem abaixo. A linha azul indica o pdf normal padrão. Supõe-se que a zona vermelha seja igual à soma das áreas cinzentas (desculpe pelo desenho horrível).
Será que podemos criar uma nova distribuição com pico mais alto deslocando as zonas cinzas para o topo (zona vermelha) do pdf normal?
Se essa transformação pode ser feita, o que você acha da curtose dessa nova distribuição? Leptokurtic? Mas tem as mesmas caudas que a distribuição normal! Indefinido?
mathematical-statistics
kurtosis
Yal dc
fonte
fonte
tail
Respostas:
Haverá um número infinito de distribuições que se parecem muito com o seu desenho, com uma variedade de valores diferentes para a curtose.
Com as condições particulares da sua pergunta e considerando que mantemos o ponto de cruzamento dentro, ou pelo menos não muito longe±1 , deve ocorrer uma curtose ligeiramente maior do que a normal. Mostrarei três casos em que isso acontece e depois mostrarei um em que é menor - e explicarei o que faz com que isso aconteça.
Dado que e são os pdf e cdf normais padrão, respectivamente, vamos escrever uma pequena funçãoΦ ( x )ϕ(x) Φ(x)
para alguma densidade simétrica contínua (com o cdf correspondente ), com média , tal que e .G 0g G 0 b=Φ(t)–½–t.ϕ(t)G(t)–½–t.g(t) a=ϕ(t)−b.g(t)
Ou seja, e são escolhidos para fazer a densidade contínua e integrar a .a b 1
Exemplo 1 Consideree,g(x)=3ϕ(3x) t=1
que se parece com o seu desenho, gerado aqui pelo seguinte código R:
Agora os cálculos. Vamos criar uma função para avaliar :xpf1(x)
para que possamos avaliar os momentos. Primeiro a variação:
Em seguida, o quarto momento central:
Precisamos da proporção desses números, que devem ter cerca de 5 dígitos de precisão
Portanto, a curtose é de cerca de 3,0955, um pouco maior do que no caso normal.
É claro que poderíamos calculá-lo algebricamente e obter uma resposta exata, mas não há necessidade, isso nos diz o que queremos saber.
Exemplo 2 Com a funçãodefinida acima, podemos tentar para todos os tipos de's.f g
Aqui está o Laplace:
Sem surpresa, um resultado semelhante.
Exemplo 3 : Vamos considerarcomo uma distribuição Cauchy (uma distribuição Student-t com 1 df), mas com a escala 2/3 (ou seja, sefor um Cauchy padrão,e, novamente, defina o limite, t (fornecendo os pontos,, fora do qual 'alternamos' para o normal), como 1.g h(x) g(x)=1.5h(1.5x) ±t
E apenas para demonstrar que realmente temos uma densidade adequada:
Exemplo 4 : No entanto , o que acontece quando alteramos t ?
Tome e como o exemplo anterior, mas altere o limite para :g G t=2
Como isso acontece?
Bem, é importante saber que a curtose é (falando levemente) 1 + a variação quadrada de :μ±σ
Todas as três distribuições têm a mesma média e variação.
A curva preta é a densidade normal padrão. A curva verde mostra uma distribuição bastante concentrada sobre (ou seja, a variação sobre é pequena, levando a uma curtose que se aproxima de 1, a menor possível). A curva vermelha mostra um caso em que a distribuição é "afastada" de ; isto é, a curtose é grande.μ±σ μ±σ μ±σ
Com isso em mente, se definirmos os pontos de limiar longe o suficiente fora de , podemos empurrar a curtose abaixo de 3 e ainda ter um pico mais alto.μ±σ
fonte
A curtose é um conceito bastante incompreendido (acho o artigo de LT De Carlo "Sobre o significado e o uso da curtose" (1997) uma discussão e apresentação sensata e valiosa das questões envolvidas).
Então, a visão ingênua e construirei uma densidade, , com "valor médio e superior mais fino no modo", em comparação com a densidade normal padrão, mas "caudas" idênticas à última. Eu não afirmam que este exposições de densidade "excesso de curtose".gX(x)
Essa densidade será necessariamente passo a passo. Para ter "caudas" esquerda e direita idênticas, sua forma funcional para os intervalos e , onde , deve ser idêntica à normal normal densidade. No intervalo do meio, , ele deve ter alguma outra forma funcional, chamada . Esse deve ser simétrico em torno de zero e satisfazer(−∞,−a) (a,∞) a>0 ϕ(x) (−a,a) h(x) h(x)
1) para que o valor da densidade no modo seja maior que o valor da normal padrão eh(0)>ϕ(0)=1/2π−−√
2) modo que seja contínuo.ϕ(−a)=h(−a)=h(a)=ϕ(a) gX(x)
, o deve integrar-se à unidade sobre o domínio, a fim de ter uma densidade adequada. Então essa densidade serágX(x)
sujeito às restrições mencionadas anteriormente sobre e também, sujeito ah(x)
que é equivalente a exigir que a massa de probabilidade abaixo de no intervalo seja igual à massa de probabilidade sob no mesmo intervalo:h(x) (−a,a) ϕ(x)
Para obter algo específico, "tentaremos" a densidade da distribuição de Laplace com média zero parah(x)
Para satisfazer os vários requisitos definidos anteriormente, devemos ter:
Para um valor mais alto no modo,
Para continuidade,
Este é um quadrático em . Seu discriminante éa
(pode ser facilmente verificado que é sempre positivo). Além disso, mantemos apenas a raiz positiva, pois éa>0
Finalmente, o requisito para a densidade se integrar à unidade se traduz em
que por integração direta leva a
que pode ser resolvido numericamente para , e assim determinar completamente a densidade que buscamos.b∗
É claro que outras formas funcionais simétricas em torno de zero poderiam ser tentadas, o pdf laplaciano era apenas para fins de exposição.
fonte
A curtose dessa distribuição provavelmente será maior que a de uma distribuição normal. Digo provavelmente porque estou baseando isso em um desenho aproximado e, embora possa ser possível provar que a massa em movimento dessa maneira sempre aumenta a curtose, não sou positivo sobre isso.
Embora seja verdade que possui as mesmas caudas que uma distribuição normal, essa distribuição terá uma variação menor do que a distribuição normal da qual é derivada. O que significa que suas caudas corresponderão às caudas de alguma distribuição normal, mas não de uma distribuição normal com a mesma variação que ela. Portanto, as caudas normalizadas serão de fato mais grossas que as caudas de uma distribuição normal. E, embora caudas mais grossas não signifiquem automaticamente mais curtose, nesse caso o quarto momento normalizado provavelmente também será maior.
fonte
Parece que o OP está tentando estabelecer uma conexão entre "pico" e curtose, mantendo as caudas fixas e tornando a distribuição mais "alta". Há um efeito na curtose aqui, mas é tão leve que dificilmente vale a pena mencionar. Aqui está um teorema para apoiar essa afirmação.
Teorema 1: Considere qualquer distribuição de probabilidade com quarto momento finito. Construa uma nova distribuição de probabilidade substituindo a massa no intervalo , mantendo a massa fora de fixa e mantendo a média e desvio padrão em . Então, a diferença entre os valores mínimo e máximo da curtose do momento de Pearson em todas essas substituições é de .[μ−σ,μ+σ] [μ−σ,μ+σ] μ,σ ≤0.25
Comentário: A prova é construtiva; você pode realmente identificar as substituições de curtose mínima e máxima nessa configuração. Além disso, 0,25 é um limite superior na faixa de curtose, dependendo da distribuição. Por exemplo, com uma distribuição normal, o limite do intervalo é 0,141, em vez de 0,25.
Por outro lado, há um enorme efeito das caudas na curtose, como é dado pelo seguinte teorema:
Teorema 2: Considere qualquer distribuição de probabilidade com quarto momento finito. Construa uma nova distribuição de probabilidade substituindo a massa fora do intervalo , mantendo a massa em fixa e mantendo a média e desvio padrão em . Então, a diferença entre os valores mínimo e máximo da curtose do momento de Pearson sobre todas essas substituições é ilimitada; ou seja, a nova distribuição pode ser escolhida para que a curtose seja aribitrariamente grande.[μ−σ,μ+σ] [μ−σ,μ+σ] μ,σ
Comentário: Esses dois teoremas mostram que o efeito das caudas na curtose do momento de Pearson é infinito, enquanto o efeito de "pico" é de .≤0.25
fonte