Qual é a distribuição da diferença de duas distribuições t

19

... e porque ?

Supondo que , são variáveis ​​aleatórias independentes com média e variação respectivamente. Meu livro de estatísticas básicas informa que a distribuição do tem as seguintes propriedades:X 2 μ 1 , μ 2 σ 2 1 , σ 2 2 X 1 - X 2X1X2μ1,μ2σ12,σ22X1-X2

  • E(X1-X2)=μ1-μ2
  • Vumar(X1-X2)=σ12+σ22

Agora, digamos , são distribuições t com , graus de liberdade. Qual é a distribuição do ?X1X2n1-1n2-2X1-X2

Esta pergunta foi editada: A pergunta original era "Quais são os graus de liberdade da diferença de duas distribuições t?" . O mpiktas já apontou que isso não faz sentido, pois não é distribuído em t, não importa quão aproximadamente normal seja o (ou seja, alta df).X1-X2X1,X2

Steffen
fonte
1
esta é uma questão relacionada que pode ser de seu interesse.
mpiktas 16/05
2
Pesquise no Google o teste t de Satterthwaite, o teste t de CABF (aproximação de Cochran de Behrens-Fisher) e o problema de Behrens-Fisher.
whuber
3
Para o caso especial em que os graus de liberdade são 1 (a distribuição de Cauchy), a resposta à pergunta original é 1. A soma (ou diferença) de duas variáveis ​​aleatórias distribuídas independentes de Cauchy é Cauchy com o parâmetro de escala 2 , mas, novamente, a A distribuição de Cauchy nem sequer tem um valor médio.
NRH 16/05
1
Você precisa verificar a distribuição de Behrens – Fisher
Wis

Respostas:

15

A soma de duas variáveis ​​aleatórias distribuídas em t independentes não é distribuída em t. Portanto, você não pode falar sobre graus de liberdade dessa distribuição, uma vez que a distribuição resultante não possui graus de liberdade no sentido que a distribuição t possui.

mpiktas
fonte
@mpiktas: pergunta idiota. Se a distribuição t com n-1 df puder ser derivada da soma de n distribuições normais independentes (consulte a Wikipedia) e receber df alta o suficiente para que a distribuição t se aproxime da distribuição normal, não derive disso que a soma de distribuições t é novamente uma distribuição t?
steffen 16/05
@mpiktas: E a estatística de teste do teste t, que parece derivar da diferença de duas distribuições t?
steffen
1
@steffen, não. Será aproximadamente normal, pois você adicionará duas variáveis ​​normais distribuídas aproximadamente normais. A distribuição t com alto df é aproximadamente normal, mas aproximadamente normal não é necessariamente distribuição t com alto df.
mpiktas 16/05
1
@steffen, a estatística do teste t é derivada da diferença de duas normais e não de duas distribuições t. Observe que a definição de distribuição t é uma fração da raiz normal e quadrada do qui-quadrado.
mpiktas 16/05
1
@ steffen, costumo dizer aos meus alunos que não há perguntas estúpidas, apenas pessoas estúpidas que não fazem perguntas. Eu não sou um professor muito popular, devo acrescentar :)
mpiktas 16/05
4

Concorde com as respostas acima, a diferença de duas variáveis ​​aleatórias distribuídas em t independentes não são distribuídas em t. Mas quero adicionar algumas maneiras de calcular isso.

  1. A maneira mais fácil de calcular isso é usando um método de Monte Carlo. Em R, por exemplo, você faz uma amostragem aleatória de 100.000 números da primeira distribuição t, depois faz uma amostragem aleatória de outros 100.000 números da segunda distribuição t. Você deixa o primeiro conjunto de 100.000 números menos o segundo conjunto de 100.000 números. Os 100.000 novos números obtidos são amostras aleatórias da distribuição da diferença entre as duas distribuições. Você pode calcular a média e a variação usando simplesmente mean()e var().

    1. Isso é chamado de distribuição Behrens – Fisher. Você pode consultar a página da Wiki: https://en.wikipedia.org/wiki/Behrens%E2%80%93Fisher_distribution . O IC fornecido por esta distribuição é chamado de "intervalo fiducial", não é um IC .

    2. A integração numérica pode funcionar. Isso é continuado como o ponto 2 do marcador. Você pode consultar a Seção 2.5.2 em Inferência Bayesiana em Análise Estatística de Box, George EP, Tiao, George C. Ele possui etapas detalhadas de integração e como isso é aproximado. uma distribuição de Behrens-Fisher.

Shijia Bian
fonte
1
Parece-me que a distribuição de Behrens-Fisher se aplica onde a variação das duas distribuições t não é igual. Pode-se dizer o mesmo se a variação das duas distribuições for igual?
11137 Ian Sudbery
1
Desculpe, pressione enter dois cedo? Para continuar ... Por exemplo, digamos que temos duas distribuições normais de variância igual mas desconhecida, mas com meios diferentes. Extraímos duas amostras de cada uma dessas distribuições. A diferença de médias entre as duas amostras da mesma distribuição seguirá uma distribuição t, mas qual é a distribuição da diferença das diferenças.
11137 Ian Sudbery