Intuição por trás da função de densidade das distribuições t

12

Estou estudando sobre a distribuição t de Student e comecei a me perguntar como derivar a função de densidade das distribuições t (da wikipedia, http://en.wikipedia.org/wiki/Student%27s_t-distribution ):

f(t)=Γ(v+12)vπΓ(v2)(1+t2v)v+12

onde são os graus de liberdade e Γ é a função gama. Qual é a intuição dessa função? Quero dizer, se eu olhar para a função de massa de probabilidade da distribuição binomial, isso faz sentido para mim. Mas a função de densidade das distribuições t não faz nenhum sentido para mim ... não é nada intuitiva à primeira vista. Ou a intuição é apenas que tem uma curva em forma de sino e serve às nossas necessidades?vΓ

Thnx por qualquer ajuda :)

jjepsuomi
fonte
3
Essa distribuição tem uma interpretação geométrica simples (e bonita). De fato, embora Student (1908) tenha derivado essa forma do PDF pela primeira vez através de um palpite inteligente (suportado pela simulação de Monte-Carlo), Fisher (c. 1920) a obteve pela primeira vez com um argumento geométrico. A essência é que descreve a distribuição da razão da altura de um (ponto uniformemente distribuído) na esfera ν + 1 e seu raio (distância do eixo): em outras palavras, a tangente de sua latitude. Uma conta disso é fornecida em evolvedmicrobe.com/Literature/GeometricTDistribution.pdf . fν+1
whuber

Respostas:

9

Se você tiver uma variável aleatória normal padrão, e uma variável aleatória qui-quadrado independente Q com ν df, entãoZQν

T=Z/Q/ν

tem uma distribuição com ν df. (Não tenho certeza de como o Z / Q é distribuído, mas não é t .)tνZ/Qt

A derivação real é um resultado bastante padrão. Alecos faz isso de várias maneiras aqui .

No que diz respeito à intuição, não tenho intuição específica para a forma funcional específica, mas é possível obter um senso geral da forma considerando que o (escalado por ν ) a distribuição independente de chi no denominador está correta:

insira a descrição da imagem aqui

O modo está um pouco abaixo de 1 (mas se aproxima de 1 à medida que o df aumenta), com alguma chance de valores substancialmente acima e abaixo de 1. A variação no significa que a variação detserá maior do que a deZ. Os valores deQ/νtZ substancialmente acima de 1 levará a umvalortmais próximo de 0 queZé, enquanto os substancialmente abaixo de 1 resultarão em umvalortmais distante de 0 queQ/νtZt é.Z

Tudo isso significa que os valores serão (i) mais variáveis, (ii) relativamente mais altos e (iii) mais pesados ​​do que o normal. À medida que o df aumenta,t fica concentrado em torno de 1 e depoistQ/νt fica mais próximo do normal.

insira a descrição da imagem aqui

(o 'relativamente mais alto' resulta em um pico um pouco mais acentuado em relação ao spread, mas a variação maior puxa o centro para baixo, o que significa que o pico é um pouco menor com um df mais baixo)

Portanto, essa é uma intuição sobre o porquê da aparência de .t

Glen_b -Reinstate Monica
fonte
1
Eu estava um pouco desleixado na minha explicação. É claro que era a raiz quadrada da variável aleatória distribuída pelo qui-quadrado dividida por seus graus de liberdade.
Analyst
@ Analista Eu já fiz o mesmo, mais de uma vez.
Glen_b -Reinstala Monica
9

A resposta de Glen é correta, mas, do ponto de vista bayesiano, também é útil pensar na distribuição t como uma mistura contínua de distribuições normais com diferentes variações. Você pode encontrar a derivação aqui:

Estudante t como mistura de gaussiana

Eu sinto que essa abordagem ajuda a sua intuição, porque esclarece como a distribuição t surge quando você não conhece a variabilidade exata de sua população.

Erik
fonte
2
Fiz uma animação da distribuição t como uma mistura de distribuições normais aqui: sumsar.net/blog/2013/12/t-as-a-mixture-of-normals
Rasmus Baas