Estou com dificuldades para implementar o estimador de probabilidade máxima para um processo multivariado de Hawkes (HP). Especificamente, enquanto a expressão analítica para uma função de probabilidade de log de um HP univariado pode ser facilmente encontrada on-line (por exemplo, Ozaki, 1979), parece haver versões diferentes (inconsistentes ou equivalentes?) Da função de probabilidade de log de um HP multivariado lá fora. Eu também tentei derivar o estimador abaixo e recebo mais um resultado (embora eu seja muito novo nesse assunto). Alguém poderia esclarecer isso para mim? Obrigado!
Esta é minha própria derivação (sigo a notação usada em Laub et al., 2015). Considere um conjunto de processos de contagem com os tempos de chegada observada para cada processo de contagem ( e um número natural). Defina um HP multivariado com funções de expiração decadentes exponencialmente, de modo que as intensidades sejam . Para este m-variável HP, a probabilidade logarítmica é igual à soma das probabilidades logarítmicas individuais, ou seja:, com cada componente individual .
Vamos primeiro focar na primeira parte, que chamamos de compensador .
Combinar isso com os resultados para as outras partes da probabilidade de log deve resultar em:
com . Uma expressão semelhante pode ser derivada para .
No entanto, quando comparo esse resultado com outros artigos, percebo algumas diferenças. Por exemplo, no Toke (slide 56) a expressão para o compensador é muito diferente (soma todos os elementos para cada tipo de evento) e também não há termoEm seguida, em Crowley (2013) (p. 29), a expressão para o compensador é muito mais elaborada. Além disso, a equação em 2.8 (página 9) em Zheng (2013) oferece novamente uma alternativa (soma um subconjunto de elementos para cada tipo de evento) (nota: existe uma implementação do Matlab no final do documento). O artigo que mais se assemelha ao que eu acho é a página 6 de Carlsson et al. (2007). Como você pode ver, estou claramente confuso. Qual é a função de probabilidade correta que devo programar?
Referências:
Ozaki, 1979, Estimativa de máxima verossimilhança dos processos pontuais emocionantes de Hawkes
Crowley, 2013, modelos de processos pontuais para dados multivariados de alta frequência com espaçamento irregular
Laub, Taimre & Pollett, 2015, Hawkes Processes
Zheng, 2013, Dinâmica de alta frequência do fluxo de pedidos
Carlsson, Foo, Lee & Shek, 2007, Previsão de Comércio de Alta Freqüência com o Processo Bivariado de Hawkes
Respostas:
Há um pequeno erro na derivação. Na linha 5 (na figura inserida), é necessário para que a identidade esteja correta, e esse geralmente não é o caso. Os termos nas somas finais devem ser e , respectivamente. Caso contrário, a derivação parece correta.T=t1,F=t2,G e−βi,1(T−t1,f)−1 e−βi,2(T−t2,g)−1
Uma derivação um pouco mais simples pode tomar a linha 3 como ponto de partida. Em seguida, permutar as somas e integração com o interior ser integral resultante de para .tj,k T
Pode-se notar que, para o processo de Hawkes considerado aqui, é possível calcular recursivamente, o que implica que a complexidade computacional da probabilidade logarítmica possa ser linear no número de saltos (em vez de quadrático, como sugere a soma dupla sobre os saltos).λ∗i(ti,j)
Duvido que existam versões inconsistentes da probabilidade na literatura, mas é claro que pode haver erros em algumas das referências. Outra possibilidade (provável) é que a notação ou as suposições sejam diferentes, ou que as representações sejam, de fato, equivalentes, mas escritas de maneiras diferentes. Uma possibilidade é que a intensidade da linha de base seja omitida, para que o termo desapareça.λi λiT
fonte