Tenha, digamos, os seguintes dados:
8232302 684531 116857 89724 82267 75988 63871
23718 1696 436 439 248 235
Deseja uma maneira simples de ajustar isso (e vários outros conjuntos de dados) a uma distribuição de Pareto. Idealmente, produziria os valores teóricos correspondentes, menos idealmente os parâmetros.
r
pareto-distribution
Felix
fonte
fonte
Respostas:
Bem, se você tem uma amostraX1, . . . , Xn de uma distribuição de pareto com os parâmetros m > 0 e α > 0 (onde m é o parâmetro do limite inferior e α é o parâmetro de forma), a probabilidade logarítmica dessa amostra é:
este é um aumento monotônico em , portanto, o maximizador é o maior valor que é consistente com os dados observados. Como o parâmetro m define o limite inferior do suporte para a distribuição de Pareto, o ideal ém m
o que não depende de . Em seguida, usando truques comuns de cálculo, o MLE para deve satisfazerαα α
alguma álgebra simples nos diz que o MLE de éα
Em muitos sentidos importantes (por exemplo, eficiência assintótica ideal, pois atinge o limite inferior de Cramer-Rao), esta é a melhor maneira de ajustar dados a uma distribuição de Pareto. O código R abaixo calcula o MLE para um determinado conjunto de dados
X
,.Edit: Com base nos comentários de @cardinal e I abaixo, também podemos observar que é o inverso da média da amostra do 's, que acontece com tem uma distribuição exponencial. Portanto, se tivermos acesso a software que possa se ajustar a uma distribuição exponencial (o que é mais provável, pois parece surgir em muitos problemas estatísticos), o ajuste de uma distribuição de Pareto poderá ser realizado transformando os dados dessa maneira e ajustando-os a uma distribuição exponencial na escala transformada. log(Xi/ m )α^ registro( XEu/ m^)
fonte
Você pode usar a
fitdist
função fornecida nofitdistrplus
pacote:fonte
library(fitdistrplus)
?library(actuar)
é necessária para que isso funcione.