Essa distribuição tem um nome? Ou o que é um processo estocástico que pode gerá-lo?

9

Uma distribuição discreta com função de massa

p(x;k)=k(x+k)(x+k1),x=1,2,

surge na página 9 deste artigo .

Para , é uma distribuição Yule-Simon com , mas não encontrei outros exemplos.ρ = 1k=1ρ=1

Isso tem um nome? Aparece em outros contextos? Existe um processo estocástico simples que pode gerá-lo?

Simon Byrne
fonte

Respostas:

13

É uma lei de poder discreta.

(Esta é uma descrição - cujo significado será explicado abaixo) - e não um termo técnico. A frase "lei da energia discreta" tem um significado técnico ligeiramente diferente, conforme indicado pelo @Cardinal nos comentários a esta resposta.)

Para ver isso, observe que a decomposição de fração parcial pode ser escrita

p(x;k)=k(x+k)(x+k1)=11+(x1)/k11+x/k.

O CDF telescópios em uma forma fechada:

CDF(i)=x=1ip(x;k)=[11+0/k11+1/k]+[11+1/k11+2/k]++[11+(i1)/k11+i/k]=11+0/k+[11+1/k+11+1/k]+[11+2/k++11+(i1)/k]11+i/k=1+0++011+i/k=ii+k.

(Aliás, porque isso é facilmente invertido, ele fornece imediatamente uma maneira eficiente de gerar variáveis ​​aleatórias a partir dessa distribuição: simplesmente calcule onde é distribuído uniformemente .)ku1uu(0,1)

A diferenciação dessa expressão em relação a mostra como o CDF pode ser escrito como uma integral,i

CDF(i)=ii+k=0idt/k(1+t/k)2=x=1ix1xdt/k(1+t/k)2,

de onde

p(x;k)=x1xdt/k(1+t/k)2.

Essa forma de escrita exibe como um parâmetro de escala para a família de distribuições (contínuas) determinadas pela densidadek

f(ξ)dξ=(1+ξ)2dξ

e mostra como é a versão discretizada de (escalonada por ) obtida pela integração da probabilidade contínua no intervalo de a . Obviamente, isso é uma lei de potência com expoente . Esta observação fornece uma entrada para uma extensa literatura sobre leis de energia e como elas surgem na ciência, engenharia e estatística, o que pode sugerir muitas respostas para suas duas últimas perguntas.p(x;k) fkx1x2

whuber
fonte
(+1) A partir da função de massa de probabilidade, fica claro que como , o que parece ser suficiente para concluir que é uma distribuição de lei de potência. De fato, como . p(x;k)kx2xp(x;k)x2/k1x
cardeal
@ cardinal Você está certo, mas há uma limitação a esse argumento: ele mostra apenas que é assintoticamente uma lei do poder. Os cálculos mostram que é exatamente uma versão discreta de uma lei de energia. p
whuber
Não tenho muita certeza da distinção que você está tentando fazer. Infelizmente, não tive a chance de pensar com cuidado, mas parece que você está definindo uma distribuição discreta das leis de energia como uma versão discretizada de uma distribuição contínua das leis de energia. Estou interpretando seu comentário corretamente? De qualquer forma, quando vejo referências a leis de poder discretas na literatura, a definição usual parece ser a mais fraca (ou seja, assintótica) que usei. (cont.)
cardeal
(Cont.) Por outro lado, uma distribuição Zipf parece ser a mais pura possível de uma lei de energia discreta, mas não creio que possa ser gerada como uma discretização de uma lei de energia contínua. Eu interpretei mal sua intenção? (A propósito, o seu desenvolvimento acima é bastante agradável. O reconhecimento da soma telescópica para o cdf é ótimo, assim como o reconhecimento de um esquema de amostragem fácil.) #
2626 de
10

Ok, depois de um pouco mais de investigação, encontrei mais alguns detalhes.

É um caso especial de uma mistura contínua de uma distribuição geométrica com uma Beta, então poderia ser chamada de distribuição Beta-geométrica . Especificamente, se: e: , a distribuição marginal de tem essa distribuição. Como tal, é um caso especial de uma distribuição binomial beta-negativa .

PBeta(1,k)
X|PGeometric(P)
Y=X+1

Tem algumas outras propriedades interessantes:

  • Tem uma média infinita
  • Ele descreve sua própria distribuição de cauda: se tiver essa distribuição com o parâmetro , então tem o parâmetro .k X - t | X > t t + kXkXt|X>tt+k
Simon Byrne
fonte