Eu tenho uma amostra que é um vetor com 220 números. Aqui está um link para um histograma dos meus dados. . E desejo verificar se meus dados se encaixam em uma distribuição de Pareto, mas não quero ver gráficos de QQ com essa distribuição, mas preciso de uma resposta exata com valor-p em R, como o teste de Anderson-Darling para normalidade ( ad.test
) . Como eu pude fazer isso? Por favor, seja o mais específico possível.
r
distributions
pareto-distribution
stjudent
fonte
fonte
Respostas:
(PS) Antes de tudo, acho que Glen_b está certo nos comentários acima sobre a utilidade de um teste: dados reais certamente não são exatamente distribuídos por Pareto, e para aplicações mais práticas a pergunta seria "quão boa é a aproximação de Pareto?" - e o gráfico QQ é uma boa maneira de mostrar a qualidade dessa aproximação.
De qualquer forma, você pode fazer seu teste com a estatística Kolmogorov-Smirnov, depois de estimar os parâmetros por máxima verossimilhança. Essa estimativa de parâmetro impede o uso do valor- de , portanto, você pode executar o bootstrap paramétrico para estimar. Como Glen_b diz no comentário, isso pode ser conectado ao teste de Lilliefors .p
ks.test
Aqui estão algumas linhas de código R.
Primeiro defina as funções básicas para lidar com as distribuições de Pareto.
A função a seguir calcula o MLE dos parâmetros (justificativas na Wikipedia ).
Agora, por exemplo, uma amostra proveniente de uma distribuição de Pareto:
Note que não afirmo que este teste seja imparcial: quando a amostra é pequena, pode existir algum viés. O bootstrap paramétrico não leva bem em conta a incerteza na estimativa do parâmetro (pense no que aconteceria ao usar essa estratégia para testar ingenuamente se a média de alguma variável normal com variação desconhecida é zero).
PS Wikipedia diz algumas palavras sobre isso. Aqui estão duas outras perguntas para as quais uma estratégia semelhante foi sugerida: Teste de qualidade do ajuste para uma mistura , teste de qualidade do ajuste para uma distribuição gama .
fonte