Preciso calcular a função de distribuição cumulativa de uma amostra de dados.
Existe algo semelhante ao hist () em R que mede a função de densidade cumulativa?
Eu tenho tentativas ecdf (), mas não consigo entender a lógica.
r
distributions
cdf
emanuele
fonte
fonte
x
basta escreverP(x)
. Note-se quex
pode ser um vetor (ver o último par de frases de minha resposta.)O que você parece precisar é disso para obter a distribuição acumulada (probabilidade de obter um valor <= x em uma amostra), ecdf retorna uma função, mas parece ter sido criada para plotagem e, portanto, o argumento dessa função , se fosse uma escada, seria o índice da banda de rodagem.
Você pode usar isto:
Infelizmente, o uso desta função não é muito rápido. Eu não sei se R tem uma função que faz isso retornando uma função, que seria mais eficiente.
fonte
R
ecdf(c(-1,0,3,9))(8)
0.75
quantile
R
Eu sempre achei
ecdf()
um pouco confuso. Além disso, acho que só funciona no caso univariado. Acabei rolando minha própria função para isso.Primeiro instale o data.table . Em seguida, instale meu pacote, mltools (ou apenas copie o método empirical_cdf () no seu ambiente R.)
Então é tão fácil quanto
CDF de um vetor
CDF da coluna 'x' de dt
CDF das colunas 'x' e 'y' de dt
fonte
amigo, você pode ler o código deste blog.
mais detalhes podem ser encontrados no seguinte link:
r cdf e histograma
fonte