Estou estudando sobre a distribuição t de Student e comecei a me perguntar como derivar a função de densidade das distribuições t (da wikipedia, http://en.wikipedia.org/wiki/Student%27s_t-distribution ):
onde são os graus de liberdade e Γ é a função gama. Qual é a intuição dessa função? Quero dizer, se eu olhar para a função de massa de probabilidade da distribuição binomial, isso faz sentido para mim. Mas a função de densidade das distribuições t não faz nenhum sentido para mim ... não é nada intuitiva à primeira vista. Ou a intuição é apenas que tem uma curva em forma de sino e serve às nossas necessidades?
Thnx por qualquer ajuda :)
probability
normal-distribution
t-distribution
jjepsuomi
fonte
fonte
Respostas:
Se você tiver uma variável aleatória normal padrão, e uma variável aleatória qui-quadrado independente Q com ν df, entãoZ Q ν
tem uma distribuição com ν df. (Não tenho certeza de como o Z / Q é distribuído, mas não é t .)t ν Z/Q t
A derivação real é um resultado bastante padrão. Alecos faz isso de várias maneiras aqui .
No que diz respeito à intuição, não tenho intuição específica para a forma funcional específica, mas é possível obter um senso geral da forma considerando que o (escalado porν−−√ ) a distribuição independente de chi no denominador está correta:
O modo está um pouco abaixo de 1 (mas se aproxima de 1 à medida que o df aumenta), com alguma chance de valores substancialmente acima e abaixo de 1. A variação no significa que a variação detserá maior do que a deZ. Os valores de √Q/ν−−−−√ t Z substancialmente acima de 1 levará a umvalortmais próximo de 0 queZé, enquanto os substancialmente abaixo de 1 resultarão em umvalortmais distante de 0 queQ/ν−−−−√ t Z t é.Z
Tudo isso significa que os valores serão (i) mais variáveis, (ii) relativamente mais altos e (iii) mais pesados do que o normal. À medida que o df aumenta,t fica concentrado em torno de 1 e depoistQ/ν−−−−√ t fica mais próximo do normal.
(o 'relativamente mais alto' resulta em um pico um pouco mais acentuado em relação ao spread, mas a variação maior puxa o centro para baixo, o que significa que o pico é um pouco menor com um df mais baixo)
Portanto, essa é uma intuição sobre o porquê da aparência de .t
fonte
A resposta de Glen é correta, mas, do ponto de vista bayesiano, também é útil pensar na distribuição t como uma mistura contínua de distribuições normais com diferentes variações. Você pode encontrar a derivação aqui:
Estudante t como mistura de gaussiana
Eu sinto que essa abordagem ajuda a sua intuição, porque esclarece como a distribuição t surge quando você não conhece a variabilidade exata de sua população.
fonte