Eu tenho um modelo de sobrevivência com pacientes aninhados em hospitais que inclui um efeito aleatório para os hospitais. O efeito aleatório é distribuído por gama, e estou tentando relatar a 'relevância' desse termo em uma escala que é facilmente compreendida.
Encontrei as seguintes referências que usam a Median Hazard Ratio (um pouco como a Median Odds Ratio) e calculei isso.
Bengtsson T, Dribe M: Métodos Históricos 43:15, 2010
No entanto, agora desejo relatar a incerteza associada a essa estimativa usando o bootstrap. Os dados são dados de sobrevivência e, portanto, existem várias observações por paciente e vários pacientes por hospital. Parece óbvio que preciso agrupar as observações do paciente ao realizar uma nova amostragem. Mas não sei se devo agrupar os hospitais também (ou seja, reamostrar hospitais, em vez de pacientes?
Gostaria de saber se a resposta depende do parâmetro de interesse e, portanto, seria diferente se o objetivo fosse algo relevante no nível do paciente e não no hospital?
Listei o código stata abaixo, caso isso ajude.
cap program drop est_mhr
program define est_mhr, rclass
stcox patient_var1 patient_var2 ///
, shared(hospital) ///
noshow
local twoinvtheta2 = 2 / (e(theta)^2)
local mhr = exp(sqrt(2*e(theta))*invF(`twoinvtheta2',`twoinvtheta2',0.75))
return scalar mhr = `mhr'
end
bootstrap r(mhr), reps(50) cluster(hospital): est_mhr
fonte
A resposta parece ser que o processo de reamostragem precisa levar em conta a estrutura dos dados. Há uma boa explicação aqui (junto com algum código R para implementar isso).
http://biostat.mc.vanderbilt.edu/wiki/Main/HowToBootstrapCorrelatedData
Agradecimentos ao ponteiro do UCLA Statistical Consulting Group .
Eu escrevi uma versão mais rápida (mas menos flexível) do snippet de código vinculado a acima - verifique aqui para atualizações e detalhes.
fonte