Eu tenho dados sobre quantos usuários publicam quantas perguntas. Por exemplo,
[UserCount, QuestionCount]
[2, 100]
[9, 10]
[3, 80]
... ...
Isso significa que 2 usuários postaram 100 perguntas, 9 usuários postaram 10 perguntas e assim por diante. Então, como posso determinar se a UserCount, QuestionCount
distribuição segue uma lei de energia?
Encontrei o pacote poweRlaw . No entanto, só posso passar um grupo de números para fazer a avaliação. (O exemplo fornecido neste pacote é a frequência das palavras.) Então, como eu uso este pacote? Ou tenho algo errado? Eu também tenho os dados da contagem de perguntas de cada usuário, ou seja [100, 100, 10, 10, 10 ... ]
,. Se eu passar esses dados para o pacote, o que receberei?
r
hypothesis-testing
goodness-of-fit
power-law
terça-feira
fonte
fonte
Respostas:
De acordo com Clauset et al., É assim que você testa a cauda da lei de energia com o
poweRlaw
pacote:as duas últimas linhas podem ser reescritas como uma linha
Além disso, neste ponto, você pode ver a estatística KS:
Isso pode levar algum tempo, então vá e pegue uma xícara de chá ...
poweRlaw
compare_distributions
comp
comp$test_statistic
data_pl
comp$p_two_side
Repita este passo com
disexp
,dispois
aulas para comparar lei de potência com essas alternativas.fonte
data("moby")
e usarmoby
em vez dedata
no meu exemplo, como na introdução