No exemplo de 8 escolas de Gelman, por que o erro padrão da estimativa individual assumida é conhecido?

17

Contexto:

No exemplo de 8 escolas de Gelman (Bayesian Data Analysis, 3ª edição, cap. 5.5), existem oito experimentos paralelos em 8 escolas testando o efeito do coaching. Cada experimento produz uma estimativa da eficácia do treinamento e do erro padrão associado.

Os autores então constroem um modelo hierárquico para os 8 pontos de dados do efeito coaching, da seguinte maneira:

yEuN(θEu,seEu)θEuN(μ,τ)

Pergunta Neste modelo, eles assumem que é conhecido. Eu não entendo essa suposição - se sentimos que precisamos modelar , por que não fazemos o mesmo para ?seEuθEuseEu

Verifiquei o artigo original de Rubin, apresentando o exemplo das 8 escolas, e também o autor diz isso (p 382):

a suposição de normalidade e erro padrão conhecido é feita rotineiramente quando resumimos um estudo com um efeito estimado e seu erro padrão, e não questionaremos seu uso aqui.

Para resumir, por que não ? Por que o tratamos como conhecido?seEu

Heisenberg
fonte
Eu suponho que eles conhecem o número total de escolas na área, então o SE é uma função do tamanho da amostra e da estimativa?
Estatísticas de aprendizado por exemplo
1
O tamanho da amostra é conhecido e corrigido, mas o erro padrão também depende do desvio padrão dos dados, e não sei por que estamos tratando isso como fixo.
Heisenberg
1
Se você está feliz em tornar seus resultados totalmente condicionais à suposição de erros padrão fixos, não há nada errado em fazer (e declarar) essa condição. Ainda porque? Ausência de um prior defensável? Ou, talvez, se os erros padrão receberem um amplo e pouco informativo anterior, o restante da análise simplesmente desaparecerá. Não sei.
Peter Leopold

Respostas:

2

Na p114 do mesmo livro, você cita: "O problema de estimar um conjunto de médias com variações desconhecidas exigirá alguns métodos computacionais adicionais, apresentados nas seções 11.6 e 13.6". É assim por simplicidade; as equações em seu capítulo funcionam de forma fechada, enquanto que se você modela as variações, elas não o fazem, e você precisa das técnicas de MCMC dos capítulos posteriores.

No exemplo da escola, eles contam com um grande tamanho de amostra para assumir que as variações são conhecidas "para todos os fins práticos" (p119), e espero que elas sejam estimadas usando e finja que esses são os valores conhecidos exatos.1n-1(xEu-x¯)2

Drew N
fonte
Entendo - eles assumem que a variação é estimada com muita precisão, em outras palavras, que o erro padrão da variação é muito pequeno?
Heisenberg
Certo. Os estimadores tendem a ser mais precisos com o aumento de e a variação não é exceção; porque é um qui-quadrado (vezes alguma constante), ele tem desvio padrão . Um denominador de cerca de 30 escolas parece suficiente para elas. nσ^22σ4/(n-1)
Drew N