Como interpretar a altura do gráfico de densidade

12

Como devo interpretar a altura dos gráficos de densidade:

insira a descrição da imagem aqui

Por exemplo, no gráfico acima, o pico é de cerca de 0,07 em x = 18. Posso deduzir que cerca de 7% dos valores estão em torno de 18? Posso ser mais específico que isso? Há também um segundo pico em x = 30 com altura de 0,02. Isso significaria que cerca de 2% dos valores estão em torno de 30?

Edit: A pergunta sobre Pode um valor de distribuição de probabilidade superior a 1 ser OK?discute o valor da probabilidade de> 1, que não é um problema aqui. Ele também discute isso em relação à ingênua classe Bayes, que também não é o ponto aqui. Eu quero ter, em linguagem simples, as inferências numéricas que podemos extrair dessas curvas de densidade. O papel da área sob a curva é discutido, mas minha pergunta é especificamente que inferência podemos extrair em relação a uma combinação xey específica que existe na curva. Por exemplo, como podemos relacionar x = 30 ey = 0,02 neste gráfico. Que afirmação podemos escrever em relação à relação entre 30 e 0,02 aqui. Como as densidades são para um valor unitário, podemos dizer que 2% dos valores ocorrem entre 29,5 e 30,5? Se for esse o caso, como interpretamos se os valores variam de apenas 0 a 1, como no gráfico a seguir:

insira a descrição da imagem aqui

Se 100% dos valores ocorrem entre 0 e 1, por que existe alguma curva fora de 0 e 1?

Existe uma parte plana aqui em x = 0,1 ex = 0,2 onde y é igual a 0,8. Forma um retângulo. Como podemos descobrir qual proporção de valores ocorre entre x = 0,1 ex = 0,2

(PS: Se você acha esta pergunta interessante / importante, por favor a vote;)

rnso
fonte
4
O primeiro segmento mencionado como duplicado é relevante, apesar da redação precisa em seu título, pois enfatiza que, conforme calculado para variáveis ​​contínuas, uma densidade de probabilidade não é uma probabilidade. (Uma versão mais subtil definiria densidade rigorosamente, e incluem a possibilidade de que a densidade é definida por medida de contagem.)
Nick Cox
Concordo com o @NickCox, embora com as edições extras, há mais foco na área (que é como a terceira pergunta) e na altura (que é mais como a segunda pergunta) na muito boa lista de questões estreitamente relacionadas de Tim.
quer
3
Há também uma questão separada que não é levantada nessas perguntas, e é por isso que não acho que seja uma duplicata geral de qualquer uma dessas perguntas individualmente: por que, nos gráficos de densidade empírica e não teórica, pode haver "densidade" fora o suporte (ou valores observados) da distribuição? Isso requer discussão adicional sobre largura de banda e a construção e interpretação de gráficos de densidade de kernel. Talvez essa pergunta se beneficie de uma edição e reorientação nos problemas que não duplicam as questões existentes.
quer

Respostas:

6

Você precisa ter cuidado com sua redação aqui. Supondo que x é uma variável contínua, a probabilidade de qualquer valor individual é precisamente zero. Falar, como você falou, sobre a probabilidade de um valor em torno de algum ponto é bom, embora você queira ser um pouco mais preciso. Sua segunda declaração, na qual você forneceu o intervalo, juntamente com a probabilidade, é algo que eu procuraria.

Em essência, uma função integral da densidade em relação a x informará sobre a probabilidade em si (é por isso que é chamada densidade ). Obviamente, o intervalo no qual você integrará pode ser arbitrariamente pequeno, para que você possa chegar perto de um ponto em um grau arbitrário. Dito isto, quando a função de densidade varia muito lentamente durante esse intervalo, é possível aproximar a integral por alguma técnica numérica, como a regra trapezoidal .

Resumindo: a altura da função densidade é exatamente isso, sua altura. Qualquer coisa que você queira concluir sobre probabilidade terá que incluir a integração de uma forma ou de outra.

Fato39
fonte
a área sob a curva sempre soma 1,0 neste tipo de plotagem?
ecologist1234
1
-