t.test retorna um erro "os dados são essencialmente constantes"

12
R version 3.1.1 (2014-07-10) -- "Sock it to Me"
> bl <- c(140, 138, 150, 148, 135)
> fu <- c(138, 136, 148, 146, 133)
> t.test(fu, bl, alternative = "two.sided", paired = TRUE)
Error in t.test.default(fu, bl, alternative = "two.sided", paired = TRUE) : 
data are essentially constant

Depois, altero apenas um caractere no meu conjunto de dados fu:

> fu <- c(138, 136, 148, 146, 132)

e corre ...

> t.test(fu, bl, alternative = "two.sided", paired = TRUE)

    Paired t-test

O que estou perdendo aqui?

ihadanny
fonte
5
Digite bl-fu. Agora sd(bl-fu). Se não é óbvio, ainda, fazer estes: dif=bl-fuem seguida, n=length(dif)em seguida, mean(dif)/(sd(dif)/sqrt(n))... você vê agora?
Glen_b -Reinstala Monica
whoops, thanks :) concorda comigo que a mensagem de erro poderia ter sido mais amigável para iniciantes. Portanto, isso significa que, no que diz respeito às estatísticas, não há necessidade de testes sofisticados e é uma certeza de que, para cada sujeito, haveria uma redução de -2 no fu em comparação ao bl?
Ihadanny

Respostas:

9

Conforme abordado nos comentários, a questão era que as diferenças eram todas 2 (ou -2, dependendo de como você escrever os pares).


Respondendo à pergunta nos comentários:

Portanto, isso significa que, no que diz respeito às estatísticas, não há necessidade de testes sofisticados e é uma certeza de que, para cada sujeito, haveria uma redução de -2 no fu em comparação ao bl?

Bem, isso depende.

Se a distribuição das diferenças realmente fosse normal, essa seria a conclusão, mas pode ser que a suposição de normalidade esteja errada e a distribuição das diferenças nas medições seja realmente discreta (talvez na população que você deseja inferir sobre isso geralmente seja -2) mas ocasionalmente diferente de -2).

De fato, vendo que todos os números são inteiros, parece que talvez seja o caso de discrição.

... nesse caso, não há tanta certeza de que todas as diferenças serão -2 na população - é mais que falta uma evidência na amostra de uma diferença na população significa algo diferente de -2.

(Por exemplo, se 87% das diferenças da população forem -2, há apenas 50-50 chances de que qualquer uma das 5 diferenças da amostra seja diferente de -2. Portanto, a amostra é bastante consistente com a variação de -2 na população)

Mas você também seria questionado sobre a adequação das suposições para o teste t - especialmente em uma amostra tão pequena.

Glen_b -Reinstate Monica
fonte
são pressões sangüíneas em mmHg na linha de base e nas verificações de acompanhamento, por isso estou bastante relaxado em assumir a normalidade e, claro, a não discrição. Foi apenas um exercício que me mostrou o quanto mais poderoso é o teste t pareado (quando disponível) sobre o não pareado.
Ihadanny