Devido ao fatorial em uma distribuição de poisson, torna-se impraticável estimar modelos de poisson (por exemplo, usando máxima verossimilhança) quando as observações são grandes. Por exemplo, se estou tentando estimar um modelo para explicar o número de suicídios em um determinado ano (apenas dados anuais estão disponíveis) e dizer que há milhares de suicídios a cada ano, é errado expressar suicídios em centenas , de modo que 2998 seria 29,98 ~ = 30? Em outras palavras, é errado alterar a unidade de medida para tornar os dados gerenciáveis?
n!
=Gamma(n+1)
para n> = 0. Portanto, tente procurar por uma função chamadaGamma
se você precisa calcular o fatorial (ou log Gamma se você está calculando a probabilidade log)Receio que você não possa fazer isso. Como afirma @Baltimark, com o lambda grande, a distribuição terá uma forma mais normal (simétrica) e, ao reduzi-la, deixará de ser uma distrubuição de poisson. Tente o seguinte código em R:
O resultado está abaixo:
Você pode ver que o poisson reduzido (linha vermelha) é completamente diferente da distribuição do poisson.
fonte
Você pode simplesmente ignorar o 'fatorial' ao usar a máxima probabilidade. Aqui está o raciocínio para o seu exemplo de suicídios. Deixei:
λ: ser o número esperado de suicídios por ano
k i : Seja o número de suicídios no ano i.
Então você maximizaria a probabilidade de log como:
LL = Σ (k i log (λ) - λ - k i !)
Maximizar o acima é equivalente a maximizar o seguinte como k i ! é uma constante:
LL ' = ∑ (k i log (λ) - λ)
Poderia explicar por que o fatorial é um problema? Estou esquecendo de algo?
fonte