Gostaria de saber se há sempre um maximizador para qualquer problema de estimativa de máxima (log-) probabilidade? Em outras palavras, existe alguma distribuição e alguns de seus parâmetros, para os quais o problema do MLE não possui um maximizador?
Minha pergunta vem de uma afirmação de um engenheiro de que a função de custo (probabilidade ou log-verossimilhança, não tenho certeza de qual era o objetivo) no MLE é sempre côncava e, portanto, sempre possui um maximizador.
Obrigado e cumprimentos!
Respostas:
Talvez o engenheiro tenha em mente as famílias exponenciais canônicas: em sua parametrização natural, o espaço dos parâmetros é convexo e a probabilidade do log é côncava (veja Thm 1.6.3 nas Estatísticas Matemáticas de Bickel & Doksum , Volume 1 ). Além disso, sob algumas condições técnicas moderadas (basicamente que o modelo seja de "classificação completa", ou equivalente, que o parâmetro natural seja identificável), a função de probabilidade de log é estritamente côncava, o que implica que existe um maximizador único. (Corolário 1.6.2 na mesma referência.) [Além disso, as notas de aula citadas por @biostat fazem o mesmo ponto.]
Observe que a parametrização natural de uma família exponencial canônica geralmente é diferente da parametrização padrão. Portanto, enquanto @cardinal ressalta que a probabilidade logarítmica da família não é convexa em σ 2 , será côncava nos parâmetros naturais, que são η 1 = μ / σ 2 e η 2 = - 1 / σ 2 .N(μ,σ2) σ2 η1=μ/σ2 η2=−1/σ2
fonte
A função de verossimilhança frequentemente atinge o máximo para a estimativa do parâmetro de interesse. No entanto, em algum momento o MLE não existe, como na distribuição de misturas gaussianas ou em funções não paramétricas, que possuem mais de um pico (bi ou multimodal). Costumo enfrentar o problema de estimar parâmetros desconhecidos da genética populacional, isto é, taxas de recombinação, efeito da seleção natural.
Um dos motivos também @cardinal aponta que é o espaço paramétrico ilimitado.
Além disso, eu recomendaria o seguinte artigo , consulte a seção 3 (para função) e a Fig.3. No entanto, existem informações de documentos bastante úteis e úteis sobre o MLE.
fonte
Eu admito que posso estar faltando alguma coisa, mas -
Se este for um problema de estimativa, e o objetivo é estimar um parâmetro desconhecido, e se sabe que o parâmetro é proveniente de um conjunto fechado e limitado, e a função de probabilidade é contínua, deve haver um valor para esse parâmetro que maximize a função de probabilidade. Em outras palavras, um máximo deve existir. (Ele não precisa ser exclusivo, mas pelo menos um máximo deve existir. Não há garantia de que todos os máximos locais sejam máximos globais, mas essa não é uma condição necessária para a existência de um máximo.)
Não sei se a função de probabilidade sempre deve ser convexa, mas essa não é uma condição necessária para que exista um máximo.
Se eu esqueci alguma coisa, gostaria de ouvir o que está faltando.
fonte
Talvez alguém ache útil o seguinte exemplo simples.
fonte