Eu tenho uma amostra de dados gerados R
por rnorm(50,0,1)
, então os dados obviamente assumem uma distribuição normal. No entanto, R
não "conhece" essas informações distributivas sobre os dados.
Existe um método para R
estimar que tipo de distribuição minha amostra vem? Caso contrário, usarei a shapiro.test
função e procederei dessa maneira.
r
distributions
James Highbright
fonte
fonte
Respostas:
Existe a
fitdistr
função no pacote MASS ou algumas das funções no pacote fitdistrplus . Aqui estão alguns exemplos deste último.então por exemplo
e você pode ver as parcelas com
então parece plausível como uma distribuição normal
mas também talvez como uma distribuição logística (você precisará de uma amostra maior para distingui-los nas caudas)
embora com um qqplot e olhando para o CDF, você possa dizer que essa provavelmente não é uma distribuição Cauchy
fonte
fitdist
fornece estimativas de parâmetros. Existem algumas dicas sobre o que a distribuição pode ser de funções como,descdist(dat, boot = 1000)
mas elas também se beneficiariam de uma amostra maior.fitdist()
é uma função no pacote fitdistrplus, e é isso que eu estava usando. Enquanto isso,fitdistr()
é uma função no pacote MASS e não funcionaria aqui neste formulário.plot(f1)
vez do mais complicadoplotdist(dat,"norm",para=list(mean=f1$estimate[1],sd=f1$estimate[2]))