Gostaria de comparar dois modelos de regressão linear que representam taxas de degradação de um mRNA ao longo do tempo sob duas condições diferentes. Os dados para cada modelo coletados independentemente.
Aqui está o conjunto de dados.
Log de tempo (horas) (tratamento A) log (tratamento B) 0 2,02 1,97 0 2,04 2,06 0 1,93 1,96 2 2,02 1,91 2 2,00 1,95 2 2,07 1,82 4 1,96 1,97 4 2,02 1,99 4 2,02 1,99 6 1,94 1,90 6 1,94 1,97 6 1,86 1,88 8 1,93 1,97 8 2,12 1,99 8 2,06 1,93 12 1,71 1,70 12 1,96 1,73 12 1,71 1,76 24 1,70 1,46 24 1,83 1,41 24 1,62 1,42
Estes são os meus modelos:
Exp1.A.lm<-lm(Exp1$Time~Exp1$(Treatment A))
Exp1.B.lm<-lm(Exp1$Time~Exp1$(Treatment B))
Ligar: lm (fórmula = Exp1 $ Tempo ~ Exp1 $ (Tratamento A)) Residuais: Mín. 1T Mediana 3T Max -6,8950 -1,2322 0,2862 1,2494 5,2494 Coeficientes: Estimativa Std. Erro t valor Pr (> | t |) (Interceptação) 74,68 6,27 11,91 2,94e-10 *** Exp1 $ (Tratamento A) -36,14 3,38 -10,69 1,77e-09 *** --- Signif. códigos: 0 '***' 0,001 '**' 0,01 '*' 0,05 '.' 0,1 '' 1 Erro padrão residual: 2,97 em 19 graus de liberdade R-quadrado múltiplo: 0,8575, R-quadrado ajustado: 0,85 Estatística F: 114,3 em 1 e 19 DF, valor de p: 1.772e-09 Ligar: lm (fórmula = Exp1 $ Tempo ~ Exp1 $ (Tratamento B)) Residuais: Mín. 1T Mediana 3T Max -7,861 -3,278 -1,444 3,222 11,972 Coeficientes: Estimativa Std. Erro t valor Pr (> | t |) (Interceptação) 88.281 16.114 5.478 2,76e-05 *** Exp1 $ (Tratamento B) -41,668 8,343 -4,994 8,05e-05 *** --- Signif. códigos: 0 '***' 0,001 '**' 0,01 '*' 0,05 '.' 0,1 '' 1 Erro padrão residual: 5.173 em 19 graus de liberdade R-quadrado múltiplo: 0,5676, R-quadrado ajustado: 0,5449 Estatística F: 24,94 em 1 e 19 DF, valor de p: 8.052e-05
Para comparar esses dois modelos, usei o seguinte código.
anova(Exp1.A.lm,Exp1.B.lm)
Tabela de Análise de Variância Modelo 1: Exp1 $ Time ~ Exp1 $ Exp1 $ (Tratamento A) Modelo 2: Exp1 $ Time ~ Exp1 $ Exp1 $ (Tratamento B) Res.Df RSS Df Soma de pés quadrados Pr (> F) 1 19 167,60 2 19 508,48 0 -340,88
Minha pergunta é por que a análise ANOVA não mostra uma estatística F e um p.val. Peço desculpas se esta é uma pergunta ingênua.
Com base em diferentes inclinações, a taxa de degradação é diferente nesses dois modelos, mas eu gostaria de saber o quão estatisticamente significativa é essa diferença. Espero que isso faça sentido.
Respostas:
Se você configurar os dados em uma coluna longa com A e B como uma nova coluna, poderá executar seu modelo de regressão como um GLM com uma variável de tempo contínua e uma variável nominal de "experimento" (A, B). A saída da ANOVA fornecerá o significado da diferença entre os parâmetros. "interceptação" é a interceptação comum e o fator "experimento" refletirá diferenças entre as interceptações (na verdade médias globais) entre os experimentos. o fator "Tempo" será a inclinação comum e a interação é a diferença entre os experimentos em relação para a encosta.
Eu tenho que admitir que trapaceio (?) E execute os modelos separadamente primeiro para obter os dois conjuntos de parâmetros e seus erros e, em seguida, execute o modelo combinado para adquirir as diferenças entre os tratamentos (no seu caso A e B) ...
fonte
A análise ANOVA não mostra uma estatística F e um valor de p, pois os dois modelos têm os mesmos graus de liberdade residual (ou seja, 19) e, se você fizer a diferença, seria zero! Depois de fazer a diferença, deve haver pelo menos um grau de liberdade para realizar o teste F.
fonte