Imagine que você repita um experimento três vezes. Em cada experimento, você coleta medições em triplicado. As triplicatas tendem a estar bastante próximas umas das outras, comparadas às diferenças entre as três médias experimentais. Computar a média geral é bem fácil. Mas como calcular um intervalo de confiança para a grande média?
Dados de amostra:
Experiência 1: 34, 41, 39
Experiência 2: 45, 51, 52
Experiência 3: 29, 31, 35
Suponha que os valores replicados em um experimento sigam uma distribuição gaussiana, assim como os valores médios de cada experimento. O desvio padrão de variação dentro de um experimento é menor que o desvio padrão entre as médias experimentais. Suponha também que não haja ordenação dos três valores em cada experimento. A ordem da esquerda para a direita dos três valores em cada linha é totalmente arbitrária.
A abordagem simples é primeiro calcular a média de cada experimento: 38.0, 49.3 e 31.7 e depois calcular a média e seu intervalo de confiança de 95% desses três valores. Usando esse método, a média geral é de 39,7, com o intervalo de confiança de 95% variando de 17,4 a 61,9.
O problema dessa abordagem é que ela ignora totalmente a variação entre triplicatas. Gostaria de saber se não há uma boa maneira de explicar essa variação.
fonte
Respostas:
Existe um intervalo de confiança exato natural para os avós no modelo ANOVA aleatório equilibrado Com efeito, é fácil verificar que a distribuição dos meios observados °° y i ∙ é ˉ y i ∙ ~ iid N ( μ , τ 2 ) com τ 2 = σ 2 b + σ 2 w
Note-se que este intervalo de confiança é nada, mas o intervalo de clássico para uma média Gaussian, considerando apenas os meios de grupo como as observaçõesy¯i∙ . Assim, a abordagem simples que você menciona:
está certo. E sua intuição sobre a variação ignorada:
está errado. Menciono também a correção de tal simplificação em /stats//a/72578/8402
Atualização 12/04/2014
Agora, alguns detalhes estão escritos no meu blog: Reduzindo um modelo para obter intervalos de confiança .
fonte
Esta é uma questão de estimativa dentro de um modelo linear de efeitos mistos. O problema é que a variação da média geral é uma soma ponderada de dois componentes de variação que devem ser estimados separadamente (por meio de uma ANOVA dos dados). As estimativas têm diferentes graus de liberdade. Portanto, embora se possa tentar construir um intervalo de confiança para a média usando as fórmulas usuais de amostra pequena (Student t), é improvável que ela atinja sua cobertura nominal, pois os desvios da média não seguirão exatamente a distribuição de Student t.
Um artigo recente (2010) de Eva Jarosova, Estimation with the Linear Mixed Effects Model , discute essa questão. (A partir de 2015, ele não parece mais estar disponível na Web.) No contexto de um conjunto de dados "pequeno" (mesmo assim, cerca de três vezes maior que este), ela usa a simulação para avaliar dois cálculos aproximados de IC (o poço conhecida aproximação de Satterthwaite e o "método de Kenward-Roger"). Suas conclusões incluem
Em suma, uma boa abordagem parece ser
Calcule um IC convencional usando as estimativas dos componentes de variação e fingindo que uma distribuição t se aplica.
Calcule também pelo menos um dos ICs ajustados.
Se os cálculos estiverem "próximos", aceite o IC convencional. Caso contrário, relate que há dados insuficientes para produzir um IC confiável.
fonte
Você não pode ter um intervalo de confiança que resolva os dois problemas. Você tem que escolher um. Você pode derivar um de um termo de erro quadrático médio da variação dentro da experiência que permite dizer algo sobre a precisão com que você pode estimar os valores na experiência ou pode fazê-lo entre e será entre experiências. Se eu fizesse o primeiro, tenderia a plotá-lo em torno de 0, em vez de em torno da média geral, porque não diz nada sobre o valor médio real, apenas sobre um efeito (neste caso, 0). Ou você pode apenas traçar os dois e descrever o que eles fazem.
Você tem uma alça no meio. Para o interior, é como calcular o termo de erro em uma ANOVA para que um MSE trabalhe e, a partir daí, o SE para o IC é apenas sqrt (MSE / n) (n = 3 neste caso).
fonte
Eu acho que o IC para média geral é muito amplo [17,62], mesmo para a variedade de dados originais.
Estes experimentos são MUITO comuns em química. Por exemplo, na certificação de materiais de referência, é necessário coletar algumas garrafas de um lote inteiro de maneira aleatória e é necessário executar análises replicadas em cada garrafa. Como você calcula o valor de referência e sua incerteza? Há muitas maneiras de fazer isso, mas o mais sofisticado (e correto, eu acho) é aplicar meta-análise ou ML (Dersimonian-Laird, Vangel-Rukhin, etc)
E as estimativas de autoinicialização?
fonte