Variação técnica versus sinal real

8

Estou testando a diferença em um resultado contínuo sob três condições diferentes.

Sob a condição AI, faça uma medição do resultado. Eu faço isso duas vezes para a mesma amostra. Os valores de exemplo podem ser 2.2, 2.1. Estas são réplicas "técnicas" provenientes da mesma fonte biológica

Eu faço o mesmo para quatro réplicas "biológicas" da condição A:

A1, measure 1: 2.2
A1, measure 2: 2.1
A2, measure 1: 2.0
A2, measure 2: 2.1
A3, measure 1: 1.9
A3, measure 2: 1.8
A4, measure 1: 1.5
A4, measure 2: 1.6

Eu também tenho condições B, C e D, com duas réplicas "técnicas" em cada uma das quatro réplicas "biológicas".

Como eu testaria o teste para diferenças médias (ANOVA) que melhor explica a variação técnica e biológica? Eu não gostaria de ajustar um modelo contando cada medição como uma observação separada, porque cada par vem da mesma amostra biológica. Estou assumindo que deve haver uma maneira melhor do que apenas calcular a média dos pares.

Bônus: como você faz isso em R?

Supondo que eu tenha dados parecidos com este:

> data
   condition sample measurement outcome
1          A      1           1     2.2
2          A      1           2     2.1
3          A      2           1     2.0
4          A      2           2     2.1
5          A      3           1     1.9
6          A      3           2     1.8
7          A      4           1     1.5
8          A      4           2     1.6
9          B      1           1     1.7
10         B      1           2     1.6
11         B      2           1     1.5
12         B      2           2     1.6
13         B      3           1     1.4
14         B      3           2     1.3
15         B      4           1     1.0
16         B      4           2     1.1
17         C      1           1     2.4
18         C      1           2     2.3
19         C      2           1     2.2
20         C      2           2     2.3
21         C      3           1     2.1
22         C      3           2     2.0
23         C      4           1     1.7
24         C      4           2     1.8

Eu provavelmente não gostaria de fazer algo assim:

summary(lm(outcome~condition, data=data))

Desde já, obrigado.

Stephen Turner
fonte

Respostas:

1

O problema é que você tem várias fontes possíveis de aleatoriedade. Aleatoriedade individual (o termo de erro normal em uma regressão linear); variação entre suas duas medidas em cada caso; e variação das unidades específicas que você amostrou. Eu acho que você provavelmente quer algo como

model <- aov(outcome ~ condition + Error(samp + measurement), data=mydata)
summary(model)

Espero que ajude.

Peter Ellis
fonte