Gráfico de divisão em R

Eu tenho um conjunto de dados de $n$ referências e $m$ subamostras em cada referência. Eu corro esses benchmarks e suas subamostras em $p$ máquinas sujeitas. O 'indivíduo' estudado pelas subamostras é o mesmo para cada máquina de assunto e os benchmarks são os mesmos para cada máquina de assunto.

Como realizo uma ANOVA em R nesta situação?

Quero principalmente calcular a média total e os intervalos de confiança. Não me importo com os meios de subamostra, mas quero reconhecer a replicação na confiança e nos meios finais. Talvez eu me importe com os meios de referência. Não consigo descobrir como configurar esta anova em R. Quero poder replicar os meios pelo cálculo manual.

Eu tentei glm, anova, aov, e lme, mas eu estou totalmente confuso. Eu acho que os resultados da ANOVA devem ser equivalentes para duas máquinas sujeitas à média aninhada da máquina / ponto de referência / ponto de verificação, mas os meios não saem da mesma forma quando eu os experimento.

Editar:

Estou começando a ter uma pista de http://zoonek2.free.fr/UNIX/48_R/13.html

r anova split-plot Alex Brown
fonte

esta pergunta foi feita várias vezes nesta lista. Esta é a resposta curta. Escrevo uma resposta detalhada no final do dia.

suncoolsu

Obrigado pela sua resposta rápida. Sinto muito por não encontrar as outras respostas, mas ainda não sou suficientemente informado sobre a terminologia para saber como fazer a pergunta.

Alex Brown

Eu acho que todos nós estamos aprendendo aqui. Está certo!

suncoolsu

A principal diferença entre o desenho de parcelas subdivididas e outros desenhos, como desenho completamente aleatório e variações de desenhos de blocos, é a estrutura de nidificação dos sujeitos, ou seja, quando as observações são obtidas do mesmo sujeito (unidade experimental) mais de uma vez. Isso leva a uma estrutura de correlação dentro de um sujeito no design de plotagem dividida, diferente da estrutura de correlação em um bloco.

Vamos tirar uma foto de exemplo do conjunto de dados a partir de um design simples de plotagem dividida (abaixo). Este é um estudo da composição da dieta em saúde, quatro dietas foram distribuídas aleatoriamente em 12 indivíduos, todos com status de saúde semelhante. A pressão arterial basal foi estabelecida e uma medida de saúde foi a alteração da pressão arterial após duas semanas. A pressão arterial foi medida de manhã e à noite. (O exemplo é copiado do exemplo do livro Statistical Design da Casella, 5.1)

\begin{array}{rcccccl} Diet 1 & Diet 2 & Diet 3 & Diet 4 \\ Subject & Subject & Subject & Subject \\ 1 2 3 & 4 5 6 & 7 8 9 & 10 11 12 \\ Morning & x x x & x x x & x x x & x x x \\ Evening & x x x & x x x & x x x & x x x \end{array}

$\begin{array}{r|ccccc|l} ~ & \text{Diet} 1 & \text{Diet} 2 & \text{Diet}3 & \text{Diet}4 \\\hline ~ & \text{Subject} & \text{Subject} & \text{Subject} &\text{Subject}\\ ~ & 1 \, 2 \, 3 & 4 \, 5 \, 6 & 7 \, 8 \, 9 & 10 \, 11 \, 12\\\hline \text{Morning} & x \, x \, x & x \, x \, x & x \, x \, x & x \, x \, x\\ \text{Evening} & x \, x \, x & x \, x \, x & x \, x \, x & x \, x \, x\\ \hline \end{array}$

Algumas coisas importantes a serem observadas:

Existem 12 unidades experimentais (12 sujeitos)
Nessas 12 unidades, observamos 24 pontos de dados ( $2 \times 4 \times 3$ ), denotado por $x$
Isso ocorre porque fazemos duas observações sobre o mesmo assunto, primeiro pela manhã e segundo à noite
Isso significa que as duas observações sobre um assunto são da mesma unidade experimental. Portanto, a replicação não é verdadeira. Como as observações são tiradas do mesmo assunto no decorrer do tempo, deve haver alguma correlação entre as duas observações.
Observe que isso é diferente de uma ANOVA bidirecional, com dieta e tempo como fatores.
Uma ANOVA de duas vias terá observações como esta:

\begin{array}{rcccccl} Diet 1 & Diet 2 & Diet 3 & Diet 4 \\ Morning & x x x & x x x & x x x & x x x \\ Evening & x x x & x x x & x x x & x x x \end{array}

$\begin{array}{r|ccccc|l} ~ & \text{Diet} 1 & \text{Diet} 2 & \text{Diet}3 & \text{Diet}4 \\\hline \text{Morning} & x \, x \, x & x \, x \, x & x \, x \, x & x \, x \, x\\ \text{Evening} & x \, x \, x & x \, x \, x & x \, x \, x & x \, x \, x\\ \hline \end{array}$

cada um dos $x$ s aqui são assuntos diferentes. Isso ilustra o conceito de aninhamento. Ou seja, os sujeitos 1, 2, 3 estão aninhados na dieta 1. - As parcelas completas, as unidades experimentais no nível de plotagem (dieta) (os sujeitos) atuam como blocos para o tratamento de plotagem dividida (manhã e noite)

O modelo para esse design de plotagem dividida é:

Y_{i j k} = μ + τ_{i} + S_{i j} + γ_{k} + (τ γ)_{i k} + ϵ_{i j k},

$Y_{ijk} = \mu + \tau_i + S_{ij} + \gamma_{k} + (\tau \gamma)_{ik} + \epsilon_{ijk},$ Onde

Y_{i j k} = the response to diet i of subject j at time k,

$Y_{ijk} = \text{the response to diet i of subject j at time k,}$

τ_{i} = diet i effect

$\tau_i = \text{diet i effect}$

S_{i j} = subject j's effect in diet i (whole plot error)

$S_{ij} = \text{subject j's effect in diet i (whole plot error)}$

(τ γ)_{i k} = the interaction of diet i and time j

$(\tau \gamma)_{ik} = \text{the interaction of diet i and time j}$

ϵ_{i j k} = split plot error

$\epsilon_{ijk} = \text{split plot error}$ Depois de ter o modelo bem formulado, escrever no R aovformulário é trivial:

splitPltMdl <- aov(bloodPressure ~ Diet + ## Diet effect 
                                   Error(Subject/Diet) + ## nesting of Subject in Diet 
                                   Time*Diet, ## interaction of Time and Diet 
                                   data = dietData)

suncoolsu
fonte

+1 boa resposta. Se você agora pudesse me explicar como você faz alguns testes post-hoc ou comparações planejadas (por exemplo, existe uma diferença entre a manhã e a noite nos grupos 1 e 2, agrupados), você me responderia muitas perguntas. Veja também minha pergunta sobre R-help: article.gmane.org/gmane.comp.lang.r.general/237681

Henrik

Estou um pouco ocupado no momento. Definitivamente vou voltar para você.

suncoolsu

@suncoolsu: ... certamente entregará?

russellpierce

Por que você não inclui o efeito Tempo na fórmula do seu modelo? Por que você inclui Diete Time*Dietna aovligação? Deve Time:Dietcorresponder à sua fórmula matemática.

Ameba

Gráfico de divisão em R

Respostas: