O fato de ser distribuído aproximadamente normalmente depende do teorema do limite central (CLT), portanto será uma melhor aproximação em amostras grandes. O CLT funciona melhor para o log de qualquer taxa (taxa de risco, taxa de chance, taxa de risco ..) do que para a própria taxa.
Em amostras adequadamente grandes, acho que essa é uma boa aproximação à variação em duas situações:
- O risco em cada grupo é constante ao longo do tempo (independentemente da taxa de risco)
- A suposição de riscos proporcionais é válida e a taxa de risco é próxima de 1
Eu acho que pode se tornar uma suposição bastante grosseira em situações distantes dessas, ou seja, se os riscos variarem consideravelmente ao longo do tempo e a taxa de risco estiver longe de 1. Se você pode fazer melhor depende de quais informações estão disponíveis. Se você tiver acesso aos dados completos, poderá ajustar um modelo de risco proporcional e obter a variação da taxa de risco de log a partir dele. Se você tiver apenas as informações em um artigo publicado, várias outras aproximações foram desenvolvidas por meta-analistas. Essas duas referências são retiradas do Cochrane Handbook :
- MKB Parmar, V. Torri e L. Stewart (1998). "Extraindo estatísticas resumidas para realizar meta-análises da literatura publicada para os objetivos de sobrevivência". Statistics in Medicine 17 (24): 2815-2834.
- Paula R. Williamson, Catrin Tudur Smith, Jane L. Hutton e Anthony G. Marson. "Meta-análise agregada de dados com resultados de tempo até o evento" . Statistics in Medicine 21 (22): 3337-3351, 2002.
Em Parmar et al, a expressão que você deria seguiria o uso de números observados no lugar do esperado na equação (5) ou a combinação das equações (6) e (12). As equações (5) e (6) são baseadas em métodos de logrank . Eles fazem referência à Kalbfleisch & Prentice pela equação (12), mas eu não tenho isso em mãos, então talvez alguém que o faça queira verificar e adicionar isso.