Considere um vetor de parâmetros , com θ 1 o parâmetro de interesse e θ 2 um parâmetro incômodo.
Se é a probabilidade construída a partir dos dados x , a probabilidade de perfil para θ 1 é definido como G P ( θ 1 ; x ) = G ( θ 1 , θ 2 ( θ 1 ) ; x ) onde θ 2 ( θ 1 ) é o de MLE θ doispara um valor fixo de .
Maximizando a probabilidade perfil com respeito a q 1 leva a mesma estimativa q 1 como a obtida através da maximização da probabilidade simultaneamente no que diz respeito a q 1 e q 2 .
Penso que o desvio padrão de θ 1 pode também ser calculada a partir da segunda derivada do perfil de risco.
A estatística de probabilidade para H 0 : θ 1 = θ 0 podem ser escritas em termos de perfil de probabilidade: G R = 2 log ( L P ( θ 1 ; x ).
Portanto, parece que a probabilidade do perfil pode ser usada exatamente como se fosse uma probabilidade genuína. É realmente esse o caso? Quais são as principais desvantagens dessa abordagem? E o 'boato' de que o estimador obtido a partir da probabilidade do perfil é enviesado (editar: mesmo que assintoticamente)?
Respostas:
A estimativa de partir da probabilidade do perfil é apenas o MLE. Maximizar em relação a θ 2 para cada θ 1 possível e depois maximizar em relação a θ 1 é o mesmo que maximizar em relação a ( θ 1 , θ 2 ) em conjunto.θ1 θ2 θ1 θ1 ( θ1, θ2)
A fraqueza fundamental é que, se você basear sua estimativa do SE de θ 1 sobre a curvatura da probabilidade perfil, você não são totalmente representando a incerteza em θ 2 .θ^1 θ2
McCullagh e Nelder, Generalized linear models, 2ª edição , têm uma seção curta sobre a probabilidade de perfil (Seção 7.2.4, páginas 254-255). Eles dizem:
fonte