Como calcular o intervalo de confiança da média das médias?

19

Imagine que você repita um experimento três vezes. Em cada experimento, você coleta medições em triplicado. As triplicatas tendem a estar bastante próximas umas das outras, comparadas às diferenças entre as três médias experimentais. Computar a média geral é bem fácil. Mas como calcular um intervalo de confiança para a grande média?

Dados de amostra:

Experiência 1: 34, 41, 39

Experiência 2: 45, 51, 52

Experiência 3: 29, 31, 35

Suponha que os valores replicados em um experimento sigam uma distribuição gaussiana, assim como os valores médios de cada experimento. O desvio padrão de variação dentro de um experimento é menor que o desvio padrão entre as médias experimentais. Suponha também que não haja ordenação dos três valores em cada experimento. A ordem da esquerda para a direita dos três valores em cada linha é totalmente arbitrária.

A abordagem simples é primeiro calcular a média de cada experimento: 38.0, 49.3 e 31.7 e depois calcular a média e seu intervalo de confiança de 95% desses três valores. Usando esse método, a média geral é de 39,7, com o intervalo de confiança de 95% variando de 17,4 a 61,9.

O problema dessa abordagem é que ela ignora totalmente a variação entre triplicatas. Gostaria de saber se não há uma boa maneira de explicar essa variação.

Harvey Motulsky
fonte
1
Não é uma resposta, apenas uma observação intuitiva. O IC para a média dos dados agrupados (todos os nove obs) é , o IC baseado apenas nas médias é . Não sei o que o seu IC está fazendo (erro de digitação? 17 não 27 e 51 não 61?), Recebo por erro padrão de três médias e como quantil de T dist com 2 df. Eu pensaria que o IC que você procura estaria em algum lugar entre esses dois - como você tem pool parcial. Podia igualmente pensar em termos de variância fórmula , cada usos CI metade da fórmula(39.7±2.13)(39.7±12.83)2.984.300.975V(Y)=E[V(Y|Yg)]+V[E(Y|Yg)]
probabilityislogic
2
@probabilityislogic: O SEM dos três meios experimentais é 5.168 (não 2,98, como você escreveu), e o intervalo de confiança que eu dei no post original (17,4 a 61,9) está correto. O SEM é calculado a partir do SD (8.95) dividindo pela raiz quadrada de n (raiz quadrada de 3). Você dividiu por n (3).
Harvey Motulsky
meu erro, também deve substituir por no intervalo de pool (mesmo erro lá)6,402.136.40
probabilityislogic
o link a seguir responde 'isso? talkstats.com/showthread.php/11554-mean-of-means
@TST, parece haver nada além de um link para a Wikipedia sobre variação combinada . Cuidado ao elaborar?
chl

Respostas:

6

Existe um intervalo de confiança exato natural para os avós no modelo ANOVA aleatório equilibrado Com efeito, é fácil verificar que a distribuição dos meios observados °° y i é ˉ y i ~ iid N ( μ , τ 2 ) com τ 2 = σ 2 b + σ 2 w

(yijμi)iidN(μi,σw2),j=1,,J,μiiidN(μ,σb2),i=1,,I.
y¯iy¯iiidN(μ,τ2) , e é sabido que a soma entre os quadradosSSbtem distribuiçãoSSbJτ2χ 2 I - 1 e é independente da média geral observada ˉ yN(μ,τ2τ2=σb2+σw2JSSb
SSbJτ2χI12
. Assim ˉ y -μ
y¯N(μ,τ2I)
tem umadistribuiçãot deStudentcomgraus de liberdadeI-1, sendo fácil obter um intervalo exato de confiança deμ.
y¯μ1ISSbJ(I1)
tI1μ

Note-se que este intervalo de confiança é nada, mas o intervalo de clássico para uma média Gaussian, considerando apenas os meios de grupo como as observaçõesy¯i . Assim, a abordagem simples que você menciona:

A abordagem simples é primeiro calcular a média de cada experimento: 38.0, 49.3 e 31.7 e depois calcular a média e seu intervalo de confiança de 95% desses três valores. Usando esse método, a média geral é de 39,7, com o intervalo de confiança de 95% variando de 17,4 a 61,9.

está certo. E sua intuição sobre a variação ignorada:

O problema dessa abordagem é que ela ignora totalmente a variação entre triplicatas. Gostaria de saber se não há uma boa maneira de explicar essa variação.

está errado. Menciono também a correção de tal simplificação em /stats//a/72578/8402

Atualização 12/04/2014

Agora, alguns detalhes estão escritos no meu blog: Reduzindo um modelo para obter intervalos de confiança .

Stéphane Laurent
fonte
Alguma ajuda para implementar esta solução em python? stackoverflow.com/questions/45682437/…
blehman
7

Esta é uma questão de estimativa dentro de um modelo linear de efeitos mistos. O problema é que a variação da média geral é uma soma ponderada de dois componentes de variação que devem ser estimados separadamente (por meio de uma ANOVA dos dados). As estimativas têm diferentes graus de liberdade. Portanto, embora se possa tentar construir um intervalo de confiança para a média usando as fórmulas usuais de amostra pequena (Student t), é improvável que ela atinja sua cobertura nominal, pois os desvios da média não seguirão exatamente a distribuição de Student t.

Um artigo recente (2010) de Eva Jarosova, Estimation with the Linear Mixed Effects Model , discute essa questão. (A partir de 2015, ele não parece mais estar disponível na Web.) No contexto de um conjunto de dados "pequeno" (mesmo assim, cerca de três vezes maior que este), ela usa a simulação para avaliar dois cálculos aproximados de IC (o poço conhecida aproximação de Satterthwaite e o "método de Kenward-Roger"). Suas conclusões incluem

O estudo de simulação revelou que a qualidade da estimativa dos parâmetros de covariância e consequentemente o ajuste dos intervalos de confiança em amostras pequenas podem ser bastante ruins ... Uma estimativa ruim pode influenciar não apenas o verdadeiro nível de confiança dos intervalos convencionais, mas também pode impossibilitar o ajuste. É óbvio que, mesmo para dados balanceados, três tipos de intervalos [convencional, Satterthwaite, KR] podem diferir substancialmente. Quando uma diferença marcante entre os intervalos convencional e o ajustado é observada, erros padrão das estimativas de parâmetros de covariância devem ser verificados. Por outro lado, quando as diferenças entre os [três] tipos de intervalos são pequenas, o ajuste parece ser desnecessário.

Em suma, uma boa abordagem parece ser

  1. Calcule um IC convencional usando as estimativas dos componentes de variação e fingindo que uma distribuição t se aplica.

  2. Calcule também pelo menos um dos ICs ajustados.

  3. Se os cálculos estiverem "próximos", aceite o IC convencional. Caso contrário, relate que há dados insuficientes para produzir um IC confiável.

whuber
fonte
O uso dos componentes de variação leva ao mesmo intervalo de confiança que calculei no post original. A tabela ANOVA possui um SS entre colunas de 480,7 com 2 df, o que significa que o MS é 240,3. O SD é sqrt (MSbetween / n) = sqrt (240.3 / 3) = 8.95, o que leva ao mesmo IC que eu publiquei originalmente (17,4 a 61,9). Achei muito difícil seguir o artigo de Jarasova que você citou e não tenho muita certeza de que seja relevante aqui (parece ser sobre projetos de medidas repetidas). ???
Harvey Motulsky
@ Harvey Sua descrição com certeza soa como medidas repetidas para mim! Acredito que o jornal Jarasova esteja no local.
whuber
1
Estou pensando na situação comum em laboratórios onde os triplicados são simplesmente três banheiras de teste diferentes (ou poços). A ordem dos três, conforme apresentado na tabela, é arbitrária. Não há conexão ou correlação entre a réplica nº 2 na primeira experiência com a réplica nº 2 na segunda ou terceira experiências. Cada experimento tem apenas três medidas. Então, não realmente medidas repetidas. Certo?
Harvey Motulsky
whuber, existe uma distribuição exata dos alunos aqui. Veja minha resposta.
Stéphane Laurent
@whuber o link que você fornece para o artigo de Eva Jarasova está morto e uma pesquisa no Google não resultou em nada. Você pode corrigir a referência?
Placidia 21/01
0

Você não pode ter um intervalo de confiança que resolva os dois problemas. Você tem que escolher um. Você pode derivar um de um termo de erro quadrático médio da variação dentro da experiência que permite dizer algo sobre a precisão com que você pode estimar os valores na experiência ou pode fazê-lo entre e será entre experiências. Se eu fizesse o primeiro, tenderia a plotá-lo em torno de 0, em vez de em torno da média geral, porque não diz nada sobre o valor médio real, apenas sobre um efeito (neste caso, 0). Ou você pode apenas traçar os dois e descrever o que eles fazem.

Você tem uma alça no meio. Para o interior, é como calcular o termo de erro em uma ANOVA para que um MSE trabalhe e, a partir daí, o SE para o IC é apenas sqrt (MSE / n) (n = 3 neste caso).

John
fonte
Na verdade, você pode ter um intervalo confiável para cada média e para a média geral. Basta usar um modelo multinível bayesiano. Às vezes, esse tipo de estimativa é chamado de pool parcial. O problema é uma amostra pequena, eu acho.
Manoel Galdino
Você pode ter um intervalo de confiança para cada média e a média geral também ... mas são coisas diferentes ... assim como os intervalos confiáveis. Eu interpretei a pergunta como sendo sobre ICs em relação à variação dentro do estudo e ao meio como um agregado. Tudo isso ainda deixa você com ICs diferentes, significando coisas diferentes. (Eu também não entendi literalmente) #
196
1
Além disso, a maneira como eu quis dizer não pode realmente não pode "não". De alguma forma, você poderia criar uma única equação que calcula um intervalo de confiança para tudo. Isso não significa nada sensato. Foi para isso que eu quis dizer não posso.
John
Alguns minutos depois que escrevi meu comentário, percebi que não deveríamos pegar n literalmente. Mas já era tarde para editá-lo =).
Manoel Galdino
0

Eu acho que o IC para média geral é muito amplo [17,62], mesmo para a variedade de dados originais.

Estes experimentos são MUITO comuns em química. Por exemplo, na certificação de materiais de referência, é necessário coletar algumas garrafas de um lote inteiro de maneira aleatória e é necessário executar análises replicadas em cada garrafa. Como você calcula o valor de referência e sua incerteza? Há muitas maneiras de fazer isso, mas o mais sofisticado (e correto, eu acho) é aplicar meta-análise ou ML (Dersimonian-Laird, Vangel-Rukhin, etc)

E as estimativas de autoinicialização?

destrua
fonte
1
A simulação (10.000 ensaios com efeitos principais e erros normalmente distribuídos) indica que [21, 58] é um IC de 95% simétrico nos dois lados da média.
whuber
whuber: Eu ficaria curioso para saber como você fez essas simulações. Bootstrapping a partir dos dados originais? Ou realmente simulações? Nesse último caso, qual valor de média e DP você usou para simular dados?
Harvey Motulsky