Interpretação de gráficos de densidade condicional

10

Gostaria de saber como interpretar corretamente os gráficos de densidade condicional. Eu inseri dois abaixo que eu criei no R com cdplot.

Por exemplo, a probabilidade do resultado é igual a 1 quando Var 1 é 150 aproximadamente 80%?

gráfico de densidade condicional

A área cinza escura é aquela que tem probabilidade condicional de Resultser igual a 1, certo?

gráfico de densidade condicional

A partir da cdplotdocumentação:

O cdplot calcula as densidades condicionais de x, dados os níveis de y ponderados pela distribuição marginal de y. As densidades são derivadas cumulativamente sobre os níveis de y.

Como essa acumulação afeta a maneira como essas plotagens são interpretadas?

nofunsalmente
fonte

Respostas:

7

Por exemplo, a probabilidade do resultado é igual a 1 quando Var 1 é 150 aproximadamente 80%?

Não, é o contrário. A probabilidade de Resultado quando Var1 é de aproximadamente 80%. Da mesma forma, a probabilidade de Resultado quando Var1 é de aproximadamente 20%.=0 0=150=1 1=150

A área cinza escura é aquela que tem probabilidade condicional de o resultado ser igual a 1, certo?

A área sombreada escura corresponde a Resultado ; a área sombreada à luz corresponde a Resultado .=0 0=1 1

Se você tiver mais de dois níveis no fator Resultado, provavelmente será mais óbvio o que está sendo retratado. Estamos acostumados a examinar as funções de densidade, para que esta apresentação possa ser confusa no início.

Como essa acumulação afeta a maneira como essas plotagens são interpretadas?

Olhando a fonte cdplot(), o que acho que está acontecendo aqui é que as proporções suavizadas dos resultados são ponderadas pela densidade da variável explicativa. Assim, as distribuições da variável dependente serão melhor representadas nas regiões de maior densidade da variável explicativa.

Uma maneira de interpretar isso é que, onde existem regiões da variável explicativa com poucos pontos, as distribuições condicionais não serão tão bem determinadas. Onde houver regiões da variável explicativa com mais pontos, as distribuições condicionais serão melhor determinadas.

jvbraun
fonte