Combinando dois intervalos de confiança / estimativas de pontos

17

Suponha que se tenha duas amostras independentes da mesma população, e métodos diferentes foram usados ​​nas duas amostras para derivar estimativas de pontos e intervalos de confiança. Em casos triviais, uma pessoa sensata apenas agruparia as duas amostras e usaria um método para fazer a análise, mas vamos supor, por enquanto, que método diferente deva ser usado devido à limitação de uma amostra, como dados ausentes. Essas duas análises separadas gerariam estimativas independentes e igualmente válidas para o atributo de interesse da população. Intuitivamente, acho que deveria haver uma maneira de combinar adequadamente essas duas estimativas, tanto em termos de estimativa pontual quanto em intervalo de confiança, resultando em um melhor procedimento de estimativa. Minha pergunta é qual deve ser a melhor maneira de fazer isso? Posso imaginar uma média ponderada de algum tipo, de acordo com o tamanho da informação / amostra em cada amostra, mas e os intervalos de confiança?

user1600
fonte

Respostas:

9

Você pode fazer uma estimativa combinada da seguinte maneira. Você pode usar as estimativas agrupadas para gerar um intervalo de confiança combinado. Especificamente, deixe:

x1¯N(μ,σ2n1)

x2¯N(μ,σ2n2)

Usando os intervalos de confiança para os dois casos, você pode reconstruir os erros padrão para as estimativas e substituir os itens acima por:

x1¯N(μ,SE1)

x2¯N(μ,SE2)

Uma estimativa combinada seria:

x¯=n1x1¯+n2x2¯n1+n2

Portanto,

x¯N(μ,n12SE1+n22SE2(n1+n2)2)=N(μ,σ2n1+n2)

Comunidade
fonte
1
β^±ZαSE. Infelizmente, às vezes o IC assimétrico pode ser mais sensível, por exemplo, o IC para uma proporção binomial quando estiver próximo de 0. Nesse caso, agrupar o SE dessa maneira pode não ajudar.
user1600
@ user1600 Bom argumento.
Esta resposta pode ser aplicada a qualquer duas distribuições, é apenas que o produto normal é normal, fornecendo uma boa solução. A simulação MCMC pode ser usada com pares de distribuições sem uma solução de forma fechada, usando uma abordagem bayesiana, sendo uma amostra a anterior e a outra a probabilidade.
David LeBauer 17/10/10
Se voltando aos intervalos de confiança do SE agrupado, quais seriam os graus de liberdade para a distribuição T? Isso mudaria se combinasse mais de 2 intervalos de confiança?
DocBuckets
3

Parece muito com meta-análise para mim. Sua suposição de que as amostras são da mesma população significa que você pode usar a meta-análise de efeito fixo (em vez da meta-análise de efeitos aleatórios). O método de variação inversa genérica usa um conjunto de estimativas independentes e suas variações como entrada, portanto, não requer os dados completos e funciona mesmo que diferentes estimadores tenham sido usados ​​para amostras diferentes. A estimativa combinada é então uma média ponderada das estimativas separadas, ponderando cada estimativa pelo inverso de sua variância. A variação da estimativa combinada é o inverso da soma dos pesos (o inverso das variações).

Você deseja trabalhar em uma escala em que a distribuição amostral da estimativa seja aproximadamente normal, ou pelo menos em uma escala em que os intervalos de confiança sejam aproximadamente simétricos; portanto, uma escala transformada em log é usual para estimativas de razão (razões de risco, razão de chances, taxa índices...). Em outros casos, uma transformação estabilizadora de variância seria útil, por exemplo, uma transformação de raiz quadrada para dados de Poisson, uma transformação de raiz quadrada em arco quadrado para dados binomiais, etc.

uma parada
fonte
1

Isso não é diferente de uma amostra estratificada. Portanto, reunir as amostras para obter uma estimativa pontual e um erro padrão parece uma abordagem razoável. As duas amostras seriam ponderadas pela proporção da amostra.

Brett
fonte