Suponha que você tenha uma variável aleatória discreta com função de massa de probabilidade no suporte . Que função tal que maximiza Para evitar lidar com casos extremos, assuma .
Perguntas relacionadas:
- Eu acredito que o que maximiza a expectativa acima também maximiza pois é monotônico. Isso está correto?
- Alguma coisa pode bater ?
Para aqueles que estão interessados, essa pergunta surge da competição CDC Flu Forecasting, onde eles usam o log da soma das probabilidades para o valor-alvo e os valores vizinhos como a função de utilidade para avaliar previsões.
probability
optimization
expected-value
kullback-leibler
jaradniemi
fonte
fonte
Respostas:
Problema legal! Como a derivação de Xi'an mostra, está relacionada à minimização da divergência de KL de Q para P. Cliff também fornece um contexto importante.
O problema pode ser resolvido trivialmente usando software de otimização, mas não vejo uma maneira de escrever uma fórmula de formulário fechado para a solução geral. Se nunca for , existe uma fórmula intuitiva.qi≥0
Quase certamente ideal (embora veja meus exemplos de gráficos no final, ele pode estar próximo). E não é o mesmo problema que . Observe que não é um objetivo equivalente a . Não é uma transformação monotônica. Expectativa é de uma soma eo log vai dentro a soma, então não é uma transformação monotônica da função objetivo.q≠p maxE[x] maxE[log(x)] x+y log(x)+log(y)
Condições KKT (isto é, condições necessárias e suficientes) para uma solução:
Defina e . O problema é:q0=0 qn+1=0
Lagrangiano: Este é um problema de otimização convexo em que a condição de Slater se mantém, portanto, as condições KKT são necessárias e condições suficientes para um ótimo. Condição de primeira ordem:
complementar: E, claro, . (Parece nos meus testes que mas não vejo imediatamente o porquê.) e são multiplicadores de Lagrange.
Solução se nunca for .qi≥0
Então considere a solução
Como escrever o problema com matrizes:
Sejam e vetores. Seja uma matriz diagonal de três bandas de unidades. Por exemplo. parap q A n=5
O problema pode ser escrito com mais notação matricial:
Isso pode ser resolvido rapidamente numericamente, mas não vejo um caminho para uma solução limpa de formulário fechado?
A solução é caracterizada por: mas não vejo como isso seja muito útil além de verificar seu software de otimização.
Código para resolvê-lo usando CVX e MATLAB
Por exemplo. entradas:
tem solução:
Solução que recebo (azul) quando tenho uma tonelada de caixas, basicamente seguindo o pdf normal (vermelho): Outro problema mais arbitrário:
Muito vagamente, para você obtém , mas se se move em torno de uma tonelada, você obtém algumas coisas complicadas onde a otimização tenta colocar o massa em no bairro de massa, estrategicamente colocando-a entre com massa.pi−1≈pi≈pi+1 qi≈pi pi qi pi pi
Outro ponto conceitual é que a incerteza em sua previsão suavizará efetivamente sua estimativa de , e um mais suave terá uma solução mais próxima de . (Eu acho que está certo.)p p q p
fonte
Como resolve e quanto a resolver para encontrar a solução para Se a solução para este sistema de equações não pertencer ao simplex , o argumento será encontrado na face do simplex .q=p
fonte
Se eu entendi isso corretamente, não acho que isso terá uma solução de formulário fechado. Ou, além disso, é pelo menos uma especialização de um problema que não está na forma fechada.
A razão pela qual digo isso é que é exatamente a probabilidade que aparece no NPMLE para dados censurados por intervalo, sendo a especialização que todos os intervalos têm a forma . Em geral, o NPMLE é o maximizador da função[X−1,X+1]
onde é a hora do evento para o sujeito , onde tudo que se sabe é que o evento ocorreu dentro do intervalo . Isso equivale exatamente ao seu problema, com e .ti i [Li,Ri] Li=Xi−1 Ri=Xi+1
Em geral, isso não está em forma fechada. No entanto, pelo menos um caso especial é; a dos dados de status atuais ou quando todos os intervalos estiverem no formato ou .[0,ci] [ci,∞)
Dito isto, existem muitos algoritmos para resolver o NPMLE! Você pode ajustar isso usando
R
oicenReg
pacote de s com aic_np
função (nota: eu sou o autor). Certifique-se de definir a opçãoB = c(1,1)
, declarando que os intervalos estão fechados.Note-se que é não o caso em que a função de que maximiza também maximiza . Como um exemplo trivial, suponha Então, e 0, de outro modo, maximiza mas é indefinido para .q E[q(X−1)+...] E[log(q(X−1)+...] X1=1,X2=1,X3=10 q(1)=1 E[q(X−1)+...] E[log(q(X−1)+...]
fonte