Na Análise de Sobrevivência, você assume que o tempo de sobrevivência de um rv seja distribuído exponencialmente. Considerando agora que eu tenho "resultados" do do iid rv . Apenas uma parte desses resultados é de fato "plenamente realizada", ou seja, as demais observações ainda estão "vivas".x 1 , … , x n X i
Se eu quisesse realizar uma estimativa de ML para o parâmetro de taxa da distribuição, como posso utilizar as observações não realizadas de maneira coerente / apropriada? Eu acredito que eles ainda contêm informações úteis para a estimativa.
Alguém poderia me guiar para a literatura sobre esse tópico? Tenho certeza que existe. No entanto, estou tendo problemas para encontrar boas palavras-chave / termos de pesquisa para o tópico.
maximum-likelihood
references
survival
censoring
exponential-family
Good Guy Mike
fonte
fonte
Respostas:
Você ainda pode estimar parâmetros usando a probabilidade diretamente. Seja as observações com a distribuição exponencial com rate e desconhecida. A função densidade é , função de distribuição cumulativa e a função de cauda . Suponha que as primeiras observações sejam totalmente observadas, enquanto que para sabemos apenas que para algumas constantes positivas conhecidas λ > 0 f ( x ; λ ) = λ e - λ x F ( x ; λ ) = 1 - e - λ x G ( x ; λ ) = 1 - F ( x ; λ ) = e - λ x r x r + 1 ,x1,…,xn λ>0 f(x;λ)=λe−λx F(x;λ)=1−e−λx G(x;λ)=1−F(x;λ)=e−λx r x j > t j t j P ( X j > t j ) = G ( t j ; λ ) L ( λ ) = r ∏ i = 1 f ( x i ; λ ) ⋅ n ∏ i = r + 1 G ( t j ; λ ) l (xr+1,…,xn xj>tj tj . Como sempre, a probabilidade é a "probabilidade dos dados observados", para as observações censuradas, que são dadas por , então a função de probabilidade total é
A função de probabilidade de log torna-se
que tem a mesma forma da probabilidade de log para o caso usual e totalmente observado, exceto no primeiro termo em local de . Escrevendo para a média de observações e tempos de censura, o estimador de probabilidade máxima de se tornaP(Xj>tj)=G(tj;λ)
Para tentar responder à pergunta nos comentários: se todas as observações foram censuradas, ou seja, não esperamos o tempo suficiente para observar qualquer evento (morte), o que podemos fazer? Nesse caso, , então a probabilidade de logar torna-se ou seja, é uma diminuição linear em . Portanto, o máximo deve ser para ! Porém, zero não é um valor válido para o parâmetro de taxa pois não corresponde a nenhuma distribuição exponencial. Devemos concluir que, neste caso, o estimador de probabilidade máxima não existe! Talvez alguém possa tentar construir algum tipo de intervalo de confiança parar=0
Mas, em qualquer caso, a conclusão real dos dados nesse caso é que devemos esperar mais tempo até obter alguns eventos ...
Aqui está como podemos construir um intervalo de confiança (unilateral) para , caso todas as observações sejam censuradas. A função de probabilidade nesse caso é , que tem a mesma forma que a função de probabilidade de um experimento binomial em que obtivemos todos os sucessos, que é (consulte também Intervalo de confiança em torno da estimativa binomial de 0 ou 1 ). Nesse caso, queremos um intervalo de confiança unilateral para no formato . Então, temos um intervalo para , resolvendo .e - λ n T p n p [ p ¯λ e−λnT pn p λ log p = - λ T[p¯,1] λ logp=−λT
Obtemos o intervalo de confiança para resolvendo para que . Finalmente, isso fornece o intervalo de confiança para : P ( X = n ) = p n ≥ 0,95 (digamos) n log p ≥ log 0,95 λ λ ≤ - log 0,95p
fonte