Estou tentando obter intuição para cada uma das principais funções da ciência atuarial (especificamente para o Modelo de Riscos Proporcionais de Cox). Aqui está o que eu tenho até agora:
- : começando no horário de início, a distribuição de probabilidade de quando você morrerá.
- : apenas a distribuição cumulativa. No momento , qual% da população estará morta?
- : . No momento , qual% da população estará viva?
- : função de perigo. Em um determinado momento , das pessoas ainda vivas, isso pode ser usado para estimar quantas pessoas morrerão no próximo intervalo de tempo, ou se o intervalo-> 0, probabilidade de morte 'instantânea'.
- : risco cumulativo. Nenhuma idéia.
Qual é a idéia por trás da combinação de valores de perigo, especialmente quando eles são contínuos? Se usarmos um exemplo discreto com taxas de mortalidade em quatro estações, e a função de perigo é a seguinte:
- A partir da primavera, todos estão vivos e 20% morrerão
- Agora no verão, dos restantes, 50% morrerão
- Agora no outono, dos restantes, 75% morrerão
- A temporada final é inverno. Dos restantes, 100% morrerão
Então o risco cumulativo é de 20%, 70%, 145%, 245% ?? O que isso significa e por que isso é útil?
Respostas:
Combinar proporções morrendo como você faz não oferece riscos cumulativos. A taxa de risco em tempo contínuo é uma probabilidade condicional de que durante um intervalo muito curto um evento ocorra:
O risco cumulativo está integrando a taxa de risco (instantânea) ao longo das idades / tempo. É como resumir probabilidades, mas como é muito pequeno, essas probabilidades também são pequenos números (por exemplo, a taxa de risco de morte pode ser de cerca de 0,004, com idades entre 30). A taxa de risco depende de não ter ocorrido o evento antes de t , portanto, para uma população, pode somar mais de 1.Δt t
Você pode procurar uma tabela de vida da mortalidade humana, embora essa seja uma formulação discreta no tempo, e tentar acumular .mx
Se você usa R, aqui está um pequeno exemplo de aproximação dessas funções a partir do número de mortes em cada intervalo de 1 ano:
Espero que isto ajude.
fonte
O livro "Uma introdução à análise de sobrevivência usando Stata" (2ª edição) de Mario Cleves tem um bom capítulo sobre esse tópico.
Você pode encontrar o capítulo em google books , p. 13-15. Mas eu aconselho a ler todo o capítulo 2.
Aqui está a forma abreviada:
fonte
Eu PERIGO um palpite de que é digno de nota devido ao seu uso em gráficos de diagnóstico:
(1) No modelo de riscos proporcionais de Coxh ( x ) = eβTzh0 0( X ) , where β and z are the coefficient and covariate vectors respectively, & h0(x) is the baseline hazard function; & so logH(x)=βTz+H0(x) . If you plot the estimate logH^(x)
against x , different covariate patterns follow parallel curves, provided the proportional hazards assumption is correct.
(2) In the Weibull modelh(x)=αθ(xθ)α−1 , where θ & α are the scale & shape parameters respectively; & so logH(x)=αlogx−αlogθ .
If you plot the estimate logH^(x)
against logx , you get a straight line with slope α^ & intercept −α^logθ^ , provided the Weibull assumption is correct. And of course a slope near to 1 suggests an exponential model might fit.
An intuitive interpretation ofH(x) is the expected number of deaths of an individual up to time x if the individual were to be resurrected after each death (without resetting time to zero).
fonte
In paraphrasing what @Scortchi is saying, I would emphasize that the cumulative hazard function does not have a nice interpretation, and as such I would not try to use it as a way to interpret results; telling a non-statistical researcher that the cumulative hazards are different will most likely result in an "mm-hm" answer and then they'll never ask about the subject again, and not in a good way.
However, the cumulative hazard function turns out to be very useful mathematically, such as a general way to link the hazard function and the survival function. So it's important to know what the cumulative hazard is and how it can be used in various statistical methods. But in general, I don't think it's particularly useful to think about real data in terms cumulative hazards.
fonte