Estimativa de parâmetros da distribuição exponencial com amostragem enviesada

8

Desejo calcular o parâmetro da distribuição exponencial de uma população de amostra retirada dessa distribuição sob condições tendenciosas. Até onde eu sei, para uma amostra de n valores, o estimador usual é . No entanto, minha amostra é tendenciosa da seguinte forma:e - λ x λ = nλeλxλ^=nxi

De uma população completa de m elementos extraídos da distribuição exponencial, apenas os n menores elementos são conhecidos. Como posso estimar o parâmetro neste cenário?λ

Um pouco mais formal, se são amostras de iid retiradas de , de modo que, para cada , temos , como posso estimar do conjunto que .e - λ x i < j X ix j λ { x 1 , x 2 , x 3 , . . . , x n } n < m{x1,x2,x3,...,xm}eλxi<jxixjλ{x1,x2,x3,...,xn}n<m

Muito obrigado!

Michael

Michael
fonte
1
Você conhece o valor de ? m
jbowman
3
Isso é censura do tipo II ( en.wikipedia.org/wiki/Censoring_%28statistics%29 ). Agora, pode ser demonstrado que a probabilidade usual na análise de sobrevivência também se aplica a um mecanismo de censura do tipo II.
Ocram
1
Os papéis de e parecem ser trocados parcialmente nesta resposta. nmn
cardeal
Obrigado, você está certo. Corrigi os papéis de me na declaração do problema.
Michael

Respostas:

8

O estimador de probabilidade máxima para o parâmetro da distribuição exponencial sob censura do tipo II pode ser derivado da seguinte maneira. Suponho que o tamanho da amostra seja , dos quais menores são observados e os maiores não são observados (mas sabemos que existem).n < m m - nmn<mmn

Vamos supor (por simplicidade notacional) que os observados estão ordenados: . Então a densidade de probabilidade conjunta de é: 0 x 1x 2x n x 1 , , x nxi0x1x2xnx1,,xn

f(x1,,xn)=m!λn(mn)!exp{λi=1nxi}exp{λ(mn)xn}

onde o primeiro exponencial se relaciona às probabilidades do observado e o segundo às probabilidades do não observado que são maiores que (que é apenas 1 - o CDF em ). Os termos de reorganização levam a:x i m - n x i x n x nnximnxixnxn

f(x1,,xn)=m!λn(mn)!exp{λ[i=1n1xi+(mn+1)xn]}

(Observe que a soma é pois existe um " " no coeficiente de .) Tomando o log, a derivada wrt e assim por diante leva ao estimador de probabilidade máxima:+ 1 x n λn1+1xnλ

λ^=n/[i=1n1xi+(mn+1)xn]

jbowman
fonte
1
Boa resposta. Você mudou e n em comparação com a pergunta por acidente? mn
Neil G
2
@ NeilG - obrigado! Acabei de notar que o OP alternado de "de uma população completa de elementos é desenhado ... apenas os n menores são conhecidos" no texto para m < n no final. Vou esclarecer quais notação que estou usando no an edit ...mnm<n
jbowman
2

Isso vincula a resposta de @ jbowman ao meu comentário. Ou seja, sob premissas de trabalho comuns, pode-se usar a 'probabilidade de sobrevivência padrão' sob censura do tipo II.

> #------seed------
> set.seed(1907)
> #----------------
> 
> #------some data------
> t <- sort(rexp(n=20, rate=2))        #true sample
> t[16:20] <- t[15]                    #observed sample
> delta <- c(rep(1, 15), rep(0, 5))    #censoring indicator
> data <- data.frame(t, delta)         #observed data
> #---------------------
> 
> #-----using @jbowman's formula------
> 15 / (sum(t[1:14]) + (5 + 1)*t[15])
[1] 2.131323
> #-----------------------------------
> 
> #------using the usual survival likelihood------
> library(survival)
> fit <- survreg(Surv(t, delta)~1, dist="exponential", data=data)
> exp(-fit$coef)
(Intercept) 
   2.131323 
> #-----------------------------------------------

PS1: Observe que isso não está restrito à distribuição exponencial.

PS2: Detalhes podem ser encontrados na Seção 2.2 do livro da Lawless .

ocram
fonte
1

n

Φ(xk)=1eλxk(k/n)xk0<k<mk

nΦkk/nk=n/2

Dave
fonte