Gráfico de divisão em R

8

Eu tenho um conjunto de dados de n referências e msubamostras em cada referência. Eu corro esses benchmarks e suas subamostras empmáquinas sujeitas. O 'indivíduo' estudado pelas subamostras é o mesmo para cada máquina de assunto e os benchmarks são os mesmos para cada máquina de assunto.

Como realizo uma ANOVA em R nesta situação?

Quero principalmente calcular a média total e os intervalos de confiança. Não me importo com os meios de subamostra, mas quero reconhecer a replicação na confiança e nos meios finais. Talvez eu me importe com os meios de referência. Não consigo descobrir como configurar esta anova em R. Quero poder replicar os meios pelo cálculo manual.

Eu tentei glm, anova, aov, e lme, mas eu estou totalmente confuso. Eu acho que os resultados da ANOVA devem ser equivalentes para duas máquinas sujeitas à média aninhada da máquina / ponto de referência / ponto de verificação, mas os meios não saem da mesma forma quando eu os experimento.

Editar:

Estou começando a ter uma pista de http://zoonek2.free.fr/UNIX/48_R/13.html

Alex Brown
fonte
1
esta pergunta foi feita várias vezes nesta lista. Esta é a resposta curta. Escrevo uma resposta detalhada no final do dia.
suncoolsu
Obrigado pela sua resposta rápida. Sinto muito por não encontrar as outras respostas, mas ainda não sou suficientemente informado sobre a terminologia para saber como fazer a pergunta.
Alex Brown
Eu acho que todos nós estamos aprendendo aqui. Está certo!
suncoolsu

Respostas:

13

A principal diferença entre o desenho de parcelas subdivididas e outros desenhos, como desenho completamente aleatório e variações de desenhos de blocos, é a estrutura de nidificação dos sujeitos, ou seja, quando as observações são obtidas do mesmo sujeito (unidade experimental) mais de uma vez. Isso leva a uma estrutura de correlação dentro de um sujeito no design de plotagem dividida, diferente da estrutura de correlação em um bloco.

Vamos tirar uma foto de exemplo do conjunto de dados a partir de um design simples de plotagem dividida (abaixo). Este é um estudo da composição da dieta em saúde, quatro dietas foram distribuídas aleatoriamente em 12 indivíduos, todos com status de saúde semelhante. A pressão arterial basal foi estabelecida e uma medida de saúde foi a alteração da pressão arterial após duas semanas. A pressão arterial foi medida de manhã e à noite. (O exemplo é copiado do exemplo do livro Statistical Design da Casella, 5.1)

 Diet1Diet2Diet3Diet4 SubjectSubjectSubjectSubject 123456789101112MorningxxxxxxxxxxxxEveningxxxxxxxxxxxx

Algumas coisas importantes a serem observadas:

  • Existem 12 unidades experimentais (12 sujeitos)
  • Nessas 12 unidades, observamos 24 pontos de dados ( 2×4×3), denotado por x
  • Isso ocorre porque fazemos duas observações sobre o mesmo assunto, primeiro pela manhã e segundo à noite
  • Isso significa que as duas observações sobre um assunto são da mesma unidade experimental. Portanto, a replicação não é verdadeira. Como as observações são tiradas do mesmo assunto no decorrer do tempo, deve haver alguma correlação entre as duas observações.
  • Observe que isso é diferente de uma ANOVA bidirecional, com dieta e tempo como fatores.
  • Uma ANOVA de duas vias terá observações como esta:

 Diet1Diet2Diet3Diet4MorningxxxxxxxxxxxxEveningxxxxxxxxxxxx

cada um dos xs aqui são assuntos diferentes. Isso ilustra o conceito de aninhamento. Ou seja, os sujeitos 1, 2, 3 estão aninhados na dieta 1. - As parcelas completas, as unidades experimentais no nível de plotagem (dieta) (os sujeitos) atuam como blocos para o tratamento de plotagem dividida (manhã e noite)

O modelo para esse design de plotagem dividida é:

Yijk=μ+τi+Sij+γk+(τγ)ik+ϵijk,
Onde
Yijk=the response to diet i of subject j at time k,
τi=diet i effect
Sij=subject j's effect in diet i (whole plot error)
(τγ)ik=the interaction of diet i and time j
ϵijk=split plot error
Depois de ter o modelo bem formulado, escrever no R aovformulário é trivial:
splitPltMdl <- aov(bloodPressure ~ Diet + ## Diet effect 
                                   Error(Subject/Diet) + ## nesting of Subject in Diet 
                                   Time*Diet, ## interaction of Time and Diet 
                                   data = dietData)
suncoolsu
fonte
1
+1 boa resposta. Se você agora pudesse me explicar como você faz alguns testes post-hoc ou comparações planejadas (por exemplo, existe uma diferença entre a manhã e a noite nos grupos 1 e 2, agrupados), você me responderia muitas perguntas. Veja também minha pergunta sobre R-help: article.gmane.org/gmane.comp.lang.r.general/237681
Henrik
Estou um pouco ocupado no momento. Definitivamente vou voltar para você.
suncoolsu
@suncoolsu: ... certamente entregará?
russellpierce
Por que você não inclui o efeito Tempo na fórmula do seu modelo? Por que você inclui Diete Time*Dietna aovligação? Deve Time:Dietcorresponder à sua fórmula matemática.
Ameba