Estimativa de densidade com uma distribuição truncada?

8

Eu tenho alguns dados que estão claramente truncados à esquerda. Desejo ajustá-lo com uma estimativa de densidade que o manipule de alguma maneira, em vez de tentar suavizá-lo.

Quais métodos conhecidos (como de costume, em R) podem resolver isso?

Código de amostra:

set.seed(1341)
x <- c(runif(30, 0, 0.01), rnorm(100,3))
hist(x, br = 10, freq = F)
lines(density(x), col = 3, lwd = 3)

insira a descrição da imagem aqui

Obrigado :)

Tal Galili
fonte
6
Este é um bom exemplo de algo que foi chamado ocasionalmente de "distribuição delta lognormal" (onde o eixo x é interpretado como logaritmos). Você pode considerar que é uma mistura de uma distribuição contínua (que parece quase normal - mas sua identificação precisa depende de você) e uma distribuição de pontos suportada perto de 0. Um modelo de mistura deve fazer um bom trabalho. Nesse caso em particular, a separação entre o átomo próximo de 0 e o restante dos dados é tão boa que seria bom remover os dados à esquerda (menos de 0,5) e estimar a densidade do restante.
whuber
2
Em alguns contextos, algo assim pode ser chamado de distribuição Tweedie , caso isso ajude à medida que você explora isso.
cardinal
Cardeal - obrigado pela referência! Whuber, estou mais interessado na parte quase 0, então a resposta de Greg abaixo é ótima. Obrigado a ambos.
precisa

Respostas:

6

O pacote logspline para R possui a função oldlogspline que estimará as densidades usando uma mistura de dados observados e censurados.

Greg Snow
fonte
5

A função de densidade também possui um fromparâmetro para indicar o lado mais à esquerda "da grade na qual a densidade deve ser estimada". Continuando do exemplo acima:

lines(density(x, from = 0), col = 4, lwd = 3)

No entanto, como você pode ver, essa é exatamente a mesma distribuição sem o fromparâmetro acima. Começa a partir de 0, só isso.

Mike T
fonte