A primeira coisa a fazer é formalizar o que queremos dizer com "cauda mais pesada". Pode-se, inicialmente, observar quão alta é a densidade na extremidade extrema depois de padronizar ambas as distribuições para terem a mesma localização e escala (por exemplo, desvio padrão):
(a partir desta resposta, que também é um pouco relevante para sua pergunta )
[Para este caso, a escala realmente não importa no final; o t ainda será "mais pesado" que o normal, mesmo se você usar escalas muito diferentes; o normal sempre diminui eventualmente]
No entanto, essa definição - embora funcione bem para essa comparação específica - não generaliza muito bem.
De maneira mais geral, uma definição muito melhor está na resposta do whuber aqui . Portanto, se for mais pesado que , como se torna suficientemente grande (para todos algum ), então , onde , onde é o cdf (para mais pesado à direita; existe uma definição semelhante e óbvia do outro lado).XYXt > t 0 S Y ( t ) > S X ( t ) S = 1 - F Ftt>t0SY(t)>SX(t)S=1−FF
Aqui está na escala logarítmica e na escala quantil do normal, o que nos permite ver mais detalhes:
Portanto, a "prova" de cauda mais pesada envolveria a comparação de cdfs e a demonstração de que a cauda superior do t-cdf eventualmente sempre fica acima da normal e a cauda inferior do t-cdf eventualmente sempre fica abaixo da normal.
Nesse caso, a coisa mais fácil a fazer é comparar as densidades e depois mostrar que a posição relativa correspondente dos cdfs (funções / sobrevivente) deve seguir a partir disso.
Por exemplo, se você pode argumentar que (em algum dado )ν
x2−(ν+1)log(1+x2ν)>2⋅log(k)†
para a constante necessária (uma função de ), para todos alguns , seria possível estabelecer uma cauda mais pesada para também na definição em termos de maior (ou maior em cauda esquerda).ν x > x 0 t ν 1 - F Fkνx>x0tν1−FF
† (esta forma segue a diferença do logaritmo das densidades, se isso mantiver a relação necessária entre as densidades)
[Na verdade, é possível mostrá-lo para qualquer (não apenas o específico de que precisamos, proveniente das constantes de normalização da densidade relevantes); portanto, o resultado deve se manter para o que precisamos.]kkk
Uma maneira de ver a diferença é usando os momentosE{xn}.
Caudas "mais pesadas" significarão valores mais altos para os momentos de potência pares (potência 4, 6, 8), quando a variação for a mesma. Em particular, o momento da 4ª ordem (em torno de zero) é chamado curtose e compara, em algum sentido exato, o peso das caudas.
Consulte a Wikipedia para obter detalhes ( https://en.wikipedia.org/wiki/Kurtosis )
fonte
Aqui está uma prova formal baseada nas funções de sobrevivência. Eu uso a seguinte definição de "cauda mais pesada", inspirada na wikipedia :
S Y ( t ) X S x ( t )Y Sy(t) X Sx(t)
Considere uma variável aleatória distribuída como t de Student com média zero, graus de liberdade e parâmetro de escala . Comparamos isso com a variável aleatória . Para ambas as variáveis, as funções de sobrevivência são diferenciáveis. Portanto,Y ν a X∼N(0,σ2)
É importante ressaltar que o resultado é válido para valores arbitrários (finitos) de , e , para que você possa ter situações em que a distribuição tenha uma variação menor que a normal, mas ainda tenha caudas mais pesadas.σ 2 νa σ2 ν
fonte