Ouvi falar da probabilidade empírica de Owen, mas até recentemente não prestava atenção até que me deparei com isso em um artigo de interesse ( Mengersen et al. 2012 ).
Em meus esforços para entendê-lo, observei que a probabilidade dos dados observados é representada como , onde e .
No entanto, não consegui dar o salto mental que liga essa representação à forma como ela pode ser usada para fazer inferências sobre as observações. Talvez eu esteja muito enraizado em pensar na probabilidade de parâmetros errados de um modelo?
Independentemente disso, tenho procurado no Google Scholar por algum artigo que emprega probabilidade empírica que me ajudaria a internalizar o conceito ... sem sucesso. Obviamente, há o livro de Art Owen sobre Probabilidade empírica , mas o Google Livros deixa de fora todos os detalhes deliciosos e ainda estou no lento processo de obter um empréstimo entre bibliotecas.
Enquanto isso, alguém pode me indicar documentos e documentos que ilustrem claramente a premissa da probabilidade empírica e como ela é empregada? Uma descrição ilustrativa do próprio EL também seria bem-vinda!
Respostas:
Não consigo pensar em lugar melhor do que o livro de Owen para aprender sobre probabilidade empírica.
Uma maneira prática de pensar em é como a probabilidade de uma distribuição multinomial nos pontos de dados observados . A probabilidade é, portanto, uma função do vetor de probabilidade , o espaço do parâmetro é realmente o simplex dimensional dos vetores de probabilidade, e o MLE está colocando peso em cada uma das observações (supondo que elas são todos diferentes). A dimensão do espaço do parâmetro aumenta com o número de observações.x 1 , … , x n ( p 1 , … , p n ) n 1 / nL=L(p1,…,pn) x1,…,xn (p1,…,pn) n 1/n
Um ponto central é que a probabilidade empírica fornece um método para calcular os intervalos de confiança através do perfil sem especificar um modelo paramétrico. Se o parâmetro de interesse é a média, , então para qualquer vetor de probabilidade , temos que a média é e podemos calcular a probabilidade do perfil como Em seguida, podemos calcular intervalos de confiança no formato com . Aqui é a média empírica eμ p=(p1,…,pn)
O livro de Owen aborda isso em detalhes e fornece extensões para problemas estatísticos mais complicados e outros parâmetros de interesse.
fonte
Em econometria, muitos trabalhos aplicados começam com a suposição de que onde é um vetor de dados, é um sistema conhecido de equações e é um parâmetro desconhecido, . A função vem de um modelo econômico. O objetivo é estimar .
A abordagem tradicional, em econometria, para estimativa e inferência em é usar o método generalizado de momentos: que é uma matriz de ponderação definida positiva e Provedores de probabilidade empírica são um estimador alternativo ao GMM. A idéia é impor a condição de momento como uma restrição ao maximizar a probabilidade não paramétrica. Primeiro, corrija um . Resolva sujeito aθ
É claro que existem muitas outras razões pelas quais EL atraiu a atenção na econometria, mas espero que este seja um ponto de partida útil. Modelos de igualdade de momento são muito comuns na economia empírica.
fonte
Na análise de sobrevivência, a curva de Kaplan-Meier é o estimador não paramétrico mais famoso da função de sobrevivência , onde denota a variável aleatória de tempo para evento. Basicamente, é uma generalização da função de distribuição empírica que permite a censura. Pode ser derivado heuristicamente, conforme indicado na maioria dos livros práticos. Mas também pode ser formalmente derivado como um estimador de probabilidade máxima (empírica). Aqui estão mais detalhes .S(t)=Pr(T>t) T S^
fonte