Estimador de probabilidade máxima para distribuições exponenciais mínimas

10

Estou preso em como resolver este problema.

Portanto, temos duas seqüências de variáveis ​​aleatórias, e para . Agora, e são distribuições exponenciais independentes com parâmetros e . No entanto, em vez de se observar e , observa-se, em vez e .Y i i = 1 , . . . , N X Y X u X Y Z WXiYii=1,...,nXYλμXYZW

Z=min(Xi,Yi) e W=1 se Zi=Xi e 0 se Zi=Yi . I tem que encontrar-formas fechadas para os estimadores de probabilidade máxima de λ e μ sobre a base de Z e W . Além disso, precisamos mostrar que esses são máximos globais.

Agora, eu sei que o mínimo de dois exponenciais independentes é ele próprio exponencial, com a taxa igual à soma das taxas, então sabemos que Z é exponencial com o parâmetro λ+μ . Portanto, nosso estimador de probabilidade máxima é: λ^+μ^=Z¯ .

Mas estou preso com aonde ir daqui. Eu sei que W é uma distribuição de Bernoulli com o parâmetro p=P(Zi=Xi) , mas não sei como converter isso em uma declaração sobre um dos parâmetros. Por exemplo, o que o MLE W¯ estimaria em termos de λ e / ou μ ? Eu entendo que se Zi=Xi , então μ=0 , mas estou tendo dificuldade em descobrir como chegar a qualquer declaração algébrica aqui.

UPDATE 1: Então me foi dito nos comentários para derivar a probabilidade para a distribuição conjunta de Z e W .

Então onde . Corrigir? Não sei de que outra forma derivar uma distribuição conjunta neste caso, uma vez que e não são independentes.P = P ( Z i = X i ) Z Wf(Z,W)=f(Z|W=1)p+f(Z|W=0)(1p)p=P(Zi=Xi)ZW

Portanto, isso nos dá, , pela definição de acima. Mas e agora? Isso não me leva a lugar nenhum. Se eu seguir as etapas de cálculo da probabilidade, obtenho: (usando e como o tamanho da amostra para cada parte da mistura ...) W m nf(Zi,Wi)=pλeλzi+(1p)μeμziWmn

L(λ,μ)=pmλmeλzi+(1p)nμneμzi

logL=mlogp+mlogλλzi+nlog(1p)+nlogμμzi

Se tomar as derivadas parciais, isto diz-me que o meu MLE estimativas de e são apenas a média do 's condicional em . Isso é,μ Z WλμZW

λ^=Zim

μ^=Zin

e

p^=mn+m

Ryan Simmons
fonte
11
Tendo acabado de responder a uma pergunta semelhante do MLE hoje, posso direcioná-lo para essa solução para algumas idéias? A relação entre as perguntas é que seus dados também se separam naturalmente em dois grupos separados: aqueles em que e aqueles em que . Tudo se resume a anotar a probabilidade de uma observação da forma ; a simetria entre e , e , produz imediatamente a probabilidade de dados do formulário e, em seguida, você está em execução. W = 1 ( Z , W ) = ( z , 0 ) X Y μ λ ( z , 1 )W=0W=1(Z,W)=(z,0)XYμλ(z,1)
whuber
Não se apresse em escrever a máxima probabilidade! Primeiro, expresse a distribuição conjunta de e deduza a probabilidade associada à amostra de , que passa a ser de forma fechada graças à suposição exponencial. Então, e somente então, você pode tentar maximizar a função e, consequentemente, obter a máxima probabilidade. ( Z i , W ) = i )(Z,W)(Zi,W)=i)
Xi'an
@whuber: (+1) é bastante simples fato e envolve a separação entre o 's eo , mas ambos os grupos envolvem ambos e , uma vez que trazem informações sobre ambos e , já que . ( z i , 0 ) u X X i Y i W i = I ( X i < Y i )(zi,1)(zi,0) μλ XiYiWi=I(Xi<Yi)
Xian
2
@ Xi'an Isso mesmo - e os paralelos com o exemplo da teoria normal que eu vinculo para continuar sendo mantidos, porque os dois grupos fornecem informações sobre o parâmetro comum (a escala), cuja estimativa envolverá assim o "agrupamento" de dados dos grupos. Aqui será visto que nos diz como a estimativa de (a taxa, ou escala inversa, para ) deve ser repartida em estimativas separadas de e . ˉ W λ + μ Z λ μσW¯λ+μZλμ
whuber
Eu li o outro tópico, whuber, mas sinceramente não entendo como aplicar isso a este exemplo. Z e W não são independentes, então como derivar a distribuição conjunta?
Ryan Simmons

Respostas:

1

Como não tenho pontos suficientes para comentar, escreverei aqui. Acho que o problema que você publica pode ser visto da perspectiva da análise de sobrevivência, se você considerar o seguinte:

Xi : verdadeiro tempo de sobrevivência,

Yi : tempo de ,

Ambos têm uma distribuição exponencial com e independentes. Então é o tempo de sobrevivência observado e o indicador de censura.Y Z i W iXYZiWi

Se você está familiarizado com a análise de sobrevivência, acredito que possa começar a partir deste ponto.

Notas: Uma boa fonte: Análise dos dados de sobrevivência da DRCox e da D.Oakes

Abaixo está um exemplo: Supondo que o pdf da distribuição do tempo de sobrevivência seja . Então a função de sobrevivência é: . E a probabilidade do log é: S ( t ) = e - ρ tf(t)=ρeρtS(t)=eρt

l=ulogf(zi)+clogS(zi)

com somatório sobre pessoas sem censura ( ) e pessoas censuradas ( ), respectivamente.uc

Devido ao fato de que que h (t) é a função de perigo, isso pode ser escrito:f(t)=h(t)S(t)

l=ulogh(zi)+logS(zi)

l=ulogρρzi

E o estimador de probabilidade máxima de é:ρ^ρ

dWi=1ρ^=d/zi que é o número total de casos dedWi=1

jujae
fonte