Por que a curtose de uma distribuição normal é 3 em vez de 0

18

O que se quer dizer com a afirmação de que a curtose de uma distribuição normal é 3. Significa que na linha horizontal o valor de 3 corresponde à probabilidade de pico, ou seja, 3 é o modo do sistema?

Quando olho para uma curva normal, parece que o pico ocorre no centro, também conhecido como 0. Então, por que a curtose não é 0 e, em vez disso, 3?

Vencedor
fonte
6
Como @Glen_b escreve, o coeficiente de "curtose" foi definido como o quarto momento padronizado: Ocorre que, para a distribuição normal,μ4=3σ4entãoβ2=3. Oexcesso de curtosegeralmente indicado porγ2éγ2=β2(Normal)-3. É preciso ter cuidado, pois algumas vezes os autores escrevem "curtose" e significam "curtose excessiva".
β2=E[(X-μ)4](E[(X-μ)2])2=μ4σ4
μ4=3σ4β2=3γ2γ2=β2(Normal)-3
Alecos Papadopoulos
1
Re: Meu comentário anterior. A expressão correta para o excesso de coeficiente de curtose é
γ2=β2-β2(Normal)=β2-3
Alecos Papadopoulos

Respostas:

29

A curtose certamente não é o local de onde está o pico. Como você diz, isso já é chamado de modo.

A curtose é o quarto momento padronizado: Se , é uma versão padronizada da variável que estamos vendo, então a curtose populacional é a quarta potência média dessa variável padronizada; E(Z4). A curtose da amostra está relacionada correspondentemente à quarta potência média de um conjunto padronizado de valores da amostra (em alguns casos, é dimensionada por um fator que chega a 1 em amostras grandes).Z=X-μσE(Z4)

Como você observa, este quarto momento padronizado é 3 no caso de uma variável aleatória normal. Como Alecos observa nos comentários, algumas pessoas definem a curtose como ; isso às vezes é chamado excesso de curtose (também é o quarto cumulante). Ao ver a palavra 'curtose', você precisa ter em mente a possibilidade de que pessoas diferentes usem a mesma palavra para se referir a duas quantidades diferentes (mas intimamente relacionadas).E(Z4)-3

A curtose é geralmente descrita como pico * (digamos, quão acentuadamente é o pico - o que era presumivelmente a intenção de escolher a palavra "curtose") ou cauda pesada (geralmente o que as pessoas estão interessadas em usá-lo para medir), mas em fato real, o quarto momento padronizado usual não mede completamente nenhuma dessas coisas.

De fato, o primeiro volume de Kendall e Stuart fornece contra-exemplos que mostram que a curtose mais alta não está necessariamente associada a um pico mais alto (em uma variável padronizada) ou a caudas mais gordas (da mesma maneira que o terceiro momento não mede exatamente o que muitas pessoas acho que sim).

No entanto, em muitas situações, há alguma tendência a se associar a ambos, já que o pico e a cauda pesada costumam ser vistos quando a curtose é maior - devemos simplesmente tomar cuidado ao pensar que é necessariamente o caso.

A curtose e a assimetria estão fortemente relacionadas (a curtose deve ser pelo menos 1 a mais que o quadrado da assimetria; a interpretação da curtose é um pouco mais fácil quando a distribuição é quase simétrica.

insira a descrição da imagem aqui

Darlington (1970) e Moors (1986) mostraram que a medida da curtose no quarto momento é de fato variabilidade sobre "os ombros" - , e Balanda e MacGillivray (1988) sugerem pensar nisso em termos vagos relacionados a esse sentido ( e considere algumas outras maneiras de medi-lo). Se a distribuição estiver concentrada perto de μ ± σ , a curtose é (necessariamente) pequena, enquanto que se a distribuição for espalhada para longe de μ ± σ (o que tenderá a empilhá-la simultaneamente no centro e mover a probabilidade para as caudas). para afastá-lo dos ombros), a curtose do quarto momento será grande.μ±σμ±σμ±σ

De Carlo (1997) é um ponto de partida razoável (depois de recursos mais básicos, como a Wikipedia) para ler sobre curtose.

E(Z4)E(Z2) (-1,1)); e vice-versa - se você colocar mais peso no centro enquanto mantém a variação em 1, também coloca um pouco na cauda.

[Nota: conforme discutido nos comentários, isso está incorreto como uma declaração geral; uma declaração um pouco diferente é necessária aqui.]

Esse efeito da variação sendo mantida constante está diretamente ligado à discussão da curtose como "variação sobre os ombros" nos artigos de Darlington e Moors. Esse resultado não é uma noção ondulada à mão, mas uma equivalência matemática clara - não se pode considerar que é o contrário sem deturpar a curtose.

(-1,1)(-1,1)

[Minha inclusão de Kendall e Stuart nas referências é porque a discussão sobre curtose também é relevante para este ponto.]

Então, o que podemos dizer? A curtose é frequentemente associada a um pico mais alto e a uma cauda mais pesada, sem ter que ocorrer também. Certamente é mais fácil levantar a curtose brincando com a cauda (já que é possível afastar mais de 1 sd) e depois ajustando o centro para manter a variação constante, mas isso não significa que o pico não tenha impacto; certamente, e pode-se manipular a curtose, concentrando-se nela. A curtose está amplamente associada, mas não apenas, ao peso da cauda - novamente, observe a variação no resultado dos ombros; se é isso que a curtose está olhando, em um sentido matemático inevitável.

Referências

Balanda, KP e MacGillivray, HL (1988),
"Kurtosis: A critical review".
American Statistician 42 , 111-119.

Darlington, Richard B. (1970),
"Kurtosis Really" Peakedness? "."
Estatístico americano 24 , 19-22.

Moors, JJA (1986),
"O significado da curtose: Darlington reexaminado".
Estatístico americano 40 , 283-284.

DeCarlo, LT (1997),
"Sobre o significado e uso da curtose".
Psychol. Methods, 2 , 292-307.

Kendall, MG e A. Stuart,
The Advanced Theory of Statistics ,
vol. 1, 3ª ed.
(edições mais recentes têm Stuart e Ord)

Glen_b -Reinstate Monica
fonte
0 03
1
Vale a pena considerar o artigo de Westfall sobre curtose, intitulado Kurtosis as Peakedness, RIP 1905-2014. Critica DeCarlo (entre outros até listados acima) por difundir o conhecimento da curtose como uma medida de pico. Link aqui: ncbi.nlm.nih.gov/pmc/articles/PMC4321753
Lil'Lobster
1
@ Lil acho Westfall exagera seu caso. Por (quase) se concentrar inteiramente em caudas pesadas, ele é estritamente incorreto. Embora a curtose esteja associada bastante fortemente às caudas pesadas, a curtose não é comprovadamente de cauda pesada (é fácil encontrar contra-exemplos em que caudas mais pesadas com menor curtose, como é abordado em algumas das referências acima; elas também são fáceis de fazer). A curtose está associada menos fortemente ao pico, mas ainda há uma associação lá; ao insistir que não é um pico, ele vai longe demais em suas críticas (críticas semelhantes se aplicam a suas próprias conclusões). ...
ctd
1
Glen_b, você e eu amamos matemática. Se você vai me criticar por "exagerar meu caso", por favor, me dê seu argumento matemático que conecta a curtose de Pearson com "pico".
Peter Westfall
1
Gelen_b, seu comentário "Isso significa que o movimento de probabilidade mais para dentro da cauda deve ser acompanhado por um pouco mais de mu + - sigma e vice-versa - se você colocar mais peso no centro enquanto mantém a variação em 1, também coloca algum na cauda "É falso. Não deve. Você pode manter a probabilidade (de fato toda a distribuição) dentro do mu + - sigma constante e aumentar a curtose ao infinito dentro de certas famílias paramétricas de distribuição. Veja aqui: math.stackexchange.com/questions/167656/…
Peter Westfall
2

Aqui está uma visualização direta para entender o que o número "3" refere em relação à curtose da distribuição normal.

Deixei X ser normalmente distribuído e deixar Z=(X-μ)/σ. DeixeiV=Z4. Considere o gráfico do pdf deV, pV(v). Essa curva está à direita de zero e se estende até o infinito, com quantia de 0,999 117,2, mas grande parte da massa está próxima de zero; por exemplo, 68% menos que 1,0.

A média dessa distribuição é curtose. Uma maneira comum de entender a média é como o "ponto de equilíbrio" do gráfico em pdf. E seX é normal, essa curva pV(v) saldos em 3.0.

Essa representação também explica por que a curtose mede o peso das caudas de uma distribuição. E seX não é normal, a curva pV(v) "cai para a direita" quando a curtose é maior que 3,0 e, nesse caso, a densidade de Xpode-se dizer que é "mais pesado que a distribuição normal". Da mesma forma, a curvapV(v) "cai para a esquerda" quando a curtose é menor que 3,0 e, nesse caso, a densidade de X pode-se dizer que é "de cauda mais clara que a distribuição normal".

Costuma-se pensar que a curtose mais alta se refere a mais massa perto do centro (ou seja, mais massa perto de 0 no pdf pV(v)) Embora em muitos casos isso seja verdade, obviamente não é a massa (possivelmente aumentada) próxima de zero que faz com que o gráfico "caia para a direita" no caso de alta curtose. Em vez disso, é a alavanca da cauda.

Deste ponto de vista, a interpretação essencialmente correta do "peso da cauda" da curtose pode ser mais especificamente caracterizada como "alavancagem da cauda" para evitar confundir "aumento do peso da cauda" com "aumento da massa na cauda". Afinal, é possível que a curtose mais alta corresponda a menos massa na cauda, ​​mas onde essa massa diminuída ocupa uma posição mais distante.

"Dê-me o lugar para ficar, e moverei a terra." -Arquimedes

Peter Westfall
fonte