O que se quer dizer com a afirmação de que a curtose de uma distribuição normal é 3. Significa que na linha horizontal o valor de 3 corresponde à probabilidade de pico, ou seja, 3 é o modo do sistema?
Quando olho para uma curva normal, parece que o pico ocorre no centro, também conhecido como 0. Então, por que a curtose não é 0 e, em vez disso, 3?
normal-distribution
moments
kurtosis
Vencedor
fonte
fonte
Respostas:
A curtose certamente não é o local de onde está o pico. Como você diz, isso já é chamado de modo.
A curtose é o quarto momento padronizado: Se , é uma versão padronizada da variável que estamos vendo, então a curtose populacional é a quarta potência média dessa variável padronizada; E(Z4). A curtose da amostra está relacionada correspondentemente à quarta potência média de um conjunto padronizado de valores da amostra (em alguns casos, é dimensionada por um fator que chega a 1 em amostras grandes).Z=X- μσ E( Z4)
Como você observa, este quarto momento padronizado é 3 no caso de uma variável aleatória normal. Como Alecos observa nos comentários, algumas pessoas definem a curtose como ; isso às vezes é chamado excesso de curtose (também é o quarto cumulante). Ao ver a palavra 'curtose', você precisa ter em mente a possibilidade de que pessoas diferentes usem a mesma palavra para se referir a duas quantidades diferentes (mas intimamente relacionadas).E( Z4) - 3
A curtose é geralmente descrita como pico * (digamos, quão acentuadamente é o pico - o que era presumivelmente a intenção de escolher a palavra "curtose") ou cauda pesada (geralmente o que as pessoas estão interessadas em usá-lo para medir), mas em fato real, o quarto momento padronizado usual não mede completamente nenhuma dessas coisas.
De fato, o primeiro volume de Kendall e Stuart fornece contra-exemplos que mostram que a curtose mais alta não está necessariamente associada a um pico mais alto (em uma variável padronizada) ou a caudas mais gordas (da mesma maneira que o terceiro momento não mede exatamente o que muitas pessoas acho que sim).
No entanto, em muitas situações, há alguma tendência a se associar a ambos, já que o pico e a cauda pesada costumam ser vistos quando a curtose é maior - devemos simplesmente tomar cuidado ao pensar que é necessariamente o caso.
A curtose e a assimetria estão fortemente relacionadas (a curtose deve ser pelo menos 1 a mais que o quadrado da assimetria; a interpretação da curtose é um pouco mais fácil quando a distribuição é quase simétrica.
Darlington (1970) e Moors (1986) mostraram que a medida da curtose no quarto momento é de fato variabilidade sobre "os ombros" - , e Balanda e MacGillivray (1988) sugerem pensar nisso em termos vagos relacionados a esse sentido ( e considere algumas outras maneiras de medi-lo). Se a distribuição estiver concentrada perto de μ ± σ , a curtose é (necessariamente) pequena, enquanto que se a distribuição for espalhada para longe de μ ± σ (o que tenderá a empilhá-la simultaneamente no centro e mover a probabilidade para as caudas). para afastá-lo dos ombros), a curtose do quarto momento será grande.μ ± σ μ ± σ μ ± σ
De Carlo (1997) é um ponto de partida razoável (depois de recursos mais básicos, como a Wikipedia) para ler sobre curtose.
[Nota: conforme discutido nos comentários, isso está incorreto como uma declaração geral; uma declaração um pouco diferente é necessária aqui.]
Esse efeito da variação sendo mantida constante está diretamente ligado à discussão da curtose como "variação sobre os ombros" nos artigos de Darlington e Moors. Esse resultado não é uma noção ondulada à mão, mas uma equivalência matemática clara - não se pode considerar que é o contrário sem deturpar a curtose.
[Minha inclusão de Kendall e Stuart nas referências é porque a discussão sobre curtose também é relevante para este ponto.]
Então, o que podemos dizer? A curtose é frequentemente associada a um pico mais alto e a uma cauda mais pesada, sem ter que ocorrer também. Certamente é mais fácil levantar a curtose brincando com a cauda (já que é possível afastar mais de 1 sd) e depois ajustando o centro para manter a variação constante, mas isso não significa que o pico não tenha impacto; certamente, e pode-se manipular a curtose, concentrando-se nela. A curtose está amplamente associada, mas não apenas, ao peso da cauda - novamente, observe a variação no resultado dos ombros; se é isso que a curtose está olhando, em um sentido matemático inevitável.
Referências
Balanda, KP e MacGillivray, HL (1988),
"Kurtosis: A critical review".
American Statistician 42 , 111-119.
Darlington, Richard B. (1970),
"Kurtosis Really" Peakedness? "."
Estatístico americano 24 , 19-22.
Moors, JJA (1986),
"O significado da curtose: Darlington reexaminado".
Estatístico americano 40 , 283-284.
DeCarlo, LT (1997),
"Sobre o significado e uso da curtose".
Psychol. Methods, 2 , 292-307.
Kendall, MG e A. Stuart,
The Advanced Theory of Statistics ,
vol. 1, 3ª ed.
(edições mais recentes têm Stuart e Ord)
fonte
Aqui está uma visualização direta para entender o que o número "3" refere em relação à curtose da distribuição normal.
DeixeiX ser normalmente distribuído e deixar Z= ( X- μ ) / σ . DeixeiV= Z4 . Considere o gráfico do pdf deV , pV( V ) . Essa curva está à direita de zero e se estende até o infinito, com quantia de 0,999 117,2, mas grande parte da massa está próxima de zero; por exemplo, 68% menos que 1,0.
A média dessa distribuição é curtose. Uma maneira comum de entender a média é como o "ponto de equilíbrio" do gráfico em pdf. E seX é normal, essa curva pV( V ) saldos em 3.0.
Essa representação também explica por que a curtose mede o peso das caudas de uma distribuição. E seX não é normal, a curva pV( V ) "cai para a direita" quando a curtose é maior que 3,0 e, nesse caso, a densidade de X pode-se dizer que é "mais pesado que a distribuição normal". Da mesma forma, a curvapV( V ) "cai para a esquerda" quando a curtose é menor que 3,0 e, nesse caso, a densidade de X pode-se dizer que é "de cauda mais clara que a distribuição normal".
Costuma-se pensar que a curtose mais alta se refere a mais massa perto do centro (ou seja, mais massa perto de 0 no pdfpV( V ) ) Embora em muitos casos isso seja verdade, obviamente não é a massa (possivelmente aumentada) próxima de zero que faz com que o gráfico "caia para a direita" no caso de alta curtose. Em vez disso, é a alavanca da cauda.
Deste ponto de vista, a interpretação essencialmente correta do "peso da cauda" da curtose pode ser mais especificamente caracterizada como "alavancagem da cauda" para evitar confundir "aumento do peso da cauda" com "aumento da massa na cauda". Afinal, é possível que a curtose mais alta corresponda a menos massa na cauda, mas onde essa massa diminuída ocupa uma posição mais distante.
"Dê-me o lugar para ficar, e moverei a terra." -Arquimedes
fonte