MLE de um processo Hawkes multivariado

9

Estou com dificuldades para implementar o estimador de probabilidade máxima para um processo multivariado de Hawkes (HP). Especificamente, enquanto a expressão analítica para uma função de probabilidade de log de um HP univariado pode ser facilmente encontrada on-line (por exemplo, Ozaki, 1979), parece haver versões diferentes (inconsistentes ou equivalentes?) Da função de probabilidade de log de um HP multivariado lá fora. Eu também tentei derivar o estimador abaixo e recebo mais um resultado (embora eu seja muito novo nesse assunto). Alguém poderia esclarecer isso para mim? Obrigado!

Esta é minha própria derivação (sigo a notação usada em Laub et al., 2015). Considere um conjunto de processos de contagem com os tempos de chegada observada para cada processo de contagem ( e um número natural). Defina um HP multivariado com funções de expiração decadentes exponencialmente, de modo que as intensidades sejam . Para este m-variável HP, a probabilidade logarítmica é igual à soma das probabilidades logarítmicas individuais, ou seja:mN=(N1,..,Nm)ti,ji=1,..,mjλi(t)=λi+j=1mtj,k<tαi,jeβi,j(ttj,k)lnL(t)lnL(t)=j=1mlnLj(t), com cada componente individual lnLj(t)=0Tλj(u)du+0Tlnλj(u)dNj(u) .

Vamos primeiro focar na primeira parte, que chamamos de compensador Λ .

insira a descrição da imagem aqui

Combinar isso com os resultados para as outras partes da probabilidade de log deve resultar em: lnL1(ti)=λ1Tα1,1β1,1f=1F[eβ1,1(t1,Ft1,f)1]α1,2β1,2g=1G[eβ1,2(t2,Gt2,g)1]+f=1Fln[λ1+j=12α1,jR1,j(f)]

com . Uma expressão semelhante pode ser derivada para .R1,j(f)=tj,k<t1,feβ1,j(t1,ftj,k)lnL2(ti)

No entanto, quando comparo esse resultado com outros artigos, percebo algumas diferenças. Por exemplo, no Toke (slide 56) a expressão para o compensador é muito diferente (soma todos os elementos para cada tipo de evento) e também não há termoEm seguida, em Crowley (2013) (p. 29), a expressão para o compensador é muito mais elaborada. Além disso, a equação em 2.8 (página 9) em Zheng (2013) oferece novamente uma alternativa (soma um subconjunto de elementos para cada tipo de evento) (nota: existe uma implementação do Matlab no final do documento). O artigo que mais se assemelha ao que eu acho é a página 6 de Carlsson et al. (2007). Como você pode ver, estou claramente confuso. Qual é a função de probabilidade correta que devo programar?λiT

Referências:

  • Ozaki, 1979, Estimativa de máxima verossimilhança dos processos pontuais emocionantes de Hawkes

  • Crowley, 2013, modelos de processos pontuais para dados multivariados de alta frequência com espaçamento irregular

  • Laub, Taimre & Pollett, 2015, Hawkes Processes

  • Zheng, 2013, Dinâmica de alta frequência do fluxo de pedidos

  • Carlsson, Foo, Lee & Shek, 2007, Previsão de Comércio de Alta Freqüência com o Processo Bivariado de Hawkes

Pilik
fonte
Se você quiser uma resposta para o motivo pelo qual o resultado difere de uma referência específica, sugiro, no mínimo, adicionar um link à referência. Melhor ainda, forneça os resultados exatos da referência na sua pergunta e explique em detalhes por que você acha que ela difere do resultado. Isso aumentará a chance de alguém fornecer uma resposta.
NRH
O link para o meu artigo é vixra.org/pdf/1211.0094v8.pdf
crow
Você recebeu uma resposta para esta pergunta? Eu notei a mesma coisa e é muito frustrante. Mesmo na página wikipedia a função é diferente: en.wikipedia.org/wiki/Point_process#Likelihood_function
Freelunch

Respostas:

3

Há um pequeno erro na derivação. Na linha 5 (na figura inserida), é necessário para que a identidade esteja correta, e esse geralmente não é o caso. Os termos nas somas finais devem ser e , respectivamente. Caso contrário, a derivação parece correta.T=t1,F=t2,Geβi,1(Tt1,f)1eβi,2(Tt2,g)1

Uma derivação um pouco mais simples pode tomar a linha 3 como ponto de partida. Em seguida, permutar as somas e integração com o interior ser integral resultante de para .tj,kT

Pode-se notar que, para o processo de Hawkes considerado aqui, é possível calcular recursivamente, o que implica que a complexidade computacional da probabilidade logarítmica possa ser linear no número de saltos (em vez de quadrático, como sugere a soma dupla sobre os saltos).λi(ti,j)

Duvido que existam versões inconsistentes da probabilidade na literatura, mas é claro que pode haver erros em algumas das referências. Outra possibilidade (provável) é que a notação ou as suposições sejam diferentes, ou que as representações sejam, de fato, equivalentes, mas escritas de maneiras diferentes. Uma possibilidade é que a intensidade da linha de base seja omitida, para que o termo desapareça.λiλiT

NRH
fonte