Posso usar um teste t emparelhado quando as amostras são normalmente distribuídas, mas a diferença não é?

12

Tenho dados de um experimento em que apliquei dois tratamentos diferentes em condições iniciais idênticas, produzindo um número inteiro entre 0 e 500 em cada caso como resultado. Quero usar um teste t emparelhado para determinar se os efeitos produzidos pelos dois tratamentos são significativamente diferentes. Os resultados para cada grupo de tratamento são normalmente distribuídos, mas a diferença entre cada par não é normalmente distribuída (assimétrica + uma cauda longa).

Posso usar um teste t emparelhado nesse caso, ou a suposição de normalidade é violada, o que significa que devo usar algum tipo de teste não paramétrico?

John Doucette
fonte
O experimento é baseado em uma simulação. Posso definir as condições iniciais da simulação como quiser. Assim, para cada par, começo com as mesmas condições iniciais e aplico dois algoritmos diferentes.
John Doucette 22/09
Pelo que você descreve esses sons, são grupos independentes. Você aplicou os dois tratamentos a cada caso ou há alguma outra correspondência? Qual é a correlação entre as condições? Sua redação é estranha ... quer dizer que você tem um valor na cauda, ​​tornando-o assimétrico?
John
Pensando nisso mais, tenho menos certeza de que eles são dependentes, mas talvez você possa esclarecer isso. A correlação análoga no mundo real seria: eu tenho uma pessoa. O tratamento um é administrado e uma medição é feita. Depois, reverto o tempo e administro o tratamento dois. Uma medição é feita novamente. Parece-me que essas medidas devem ser consideradas correlacionadas. Talvez não devessem?
John Doucette 22/09
Além disso, com o não-normalidade, a distribuição é tanto assimétrica e tem uma cauda longa (com múltiplos valores extremos). Remover alguns dos outliers não o tornaria normal.
John Doucette 22/09
3
Se as distribuições univariadas forem normais e independentes, a distribuição das diferenças deverá ser normal. Sua falta de normalidade demonstra uma dependência entre as duas distribuições. A dependência não é apenas a da correlação: deve haver algo mais acontecendo também.
whuber

Respostas:

13

Um teste t pareado analisa apenas a lista de diferenças pareadas e assume que a amostra de valores é amostrada aleatoriamente em uma população gaussiana. Se essa suposição for violada, o teste t emparelhado não é válido. A distribuição a partir da qual os valores antes e depois são amostras é irrelevante - apenas a população em que as diferenças são amostradas.

Harvey Motulsky
fonte
Então, digamos que se eu analisasse um modelo não linear e gerasse y_observed at time = i. Posso fazer um teste t emparelhado que compara cada um dos valores observados com o valor real no momento i? Vamos supor também que eu tenho os dados observados para intervalos de tempo 100, e prever os meus números para os mesmos intervalos
dassouki