Contexto:
No exemplo de 8 escolas de Gelman (Bayesian Data Analysis, 3ª edição, cap. 5.5), existem oito experimentos paralelos em 8 escolas testando o efeito do coaching. Cada experimento produz uma estimativa da eficácia do treinamento e do erro padrão associado.
Os autores então constroem um modelo hierárquico para os 8 pontos de dados do efeito coaching, da seguinte maneira:
Pergunta Neste modelo, eles assumem que é conhecido. Eu não entendo essa suposição - se sentimos que precisamos modelar , por que não fazemos o mesmo para ?
Verifiquei o artigo original de Rubin, apresentando o exemplo das 8 escolas, e também o autor diz isso (p 382):
a suposição de normalidade e erro padrão conhecido é feita rotineiramente quando resumimos um estudo com um efeito estimado e seu erro padrão, e não questionaremos seu uso aqui.
Para resumir, por que não ? Por que o tratamos como conhecido?
fonte
Respostas:
Na p114 do mesmo livro, você cita: "O problema de estimar um conjunto de médias com variações desconhecidas exigirá alguns métodos computacionais adicionais, apresentados nas seções 11.6 e 13.6". É assim por simplicidade; as equações em seu capítulo funcionam de forma fechada, enquanto que se você modela as variações, elas não o fazem, e você precisa das técnicas de MCMC dos capítulos posteriores.
No exemplo da escola, eles contam com um grande tamanho de amostra para assumir que as variações são conhecidas "para todos os fins práticos" (p119), e espero que elas sejam estimadas usando e finja que esses são os valores conhecidos exatos.1n - 1∑ ( xEu- x¯¯¯)2
fonte