Por exemplo, a probabilidade do resultado é igual a 1 quando Var 1 é 150 aproximadamente 80%?
Não, é o contrário. A probabilidade de Resultado quando Var1 é de aproximadamente 80%. Da mesma forma, a probabilidade de Resultado quando Var1 é de aproximadamente 20%.= 0= 150= 1= 150
A área cinza escura é aquela que tem probabilidade condicional de o resultado ser igual a 1, certo?
A área sombreada escura corresponde a Resultado ; a área sombreada à luz corresponde a Resultado .= 0= 1
Se você tiver mais de dois níveis no fator Resultado, provavelmente será mais óbvio o que está sendo retratado. Estamos acostumados a examinar as funções de densidade, para que esta apresentação possa ser confusa no início.
Como essa acumulação afeta a maneira como essas plotagens são interpretadas?
Olhando a fonte cdplot()
, o que acho que está acontecendo aqui é que as proporções suavizadas dos resultados são ponderadas pela densidade da variável explicativa. Assim, as distribuições da variável dependente serão melhor representadas nas regiões de maior densidade da variável explicativa.
Uma maneira de interpretar isso é que, onde existem regiões da variável explicativa com poucos pontos, as distribuições condicionais não serão tão bem determinadas. Onde houver regiões da variável explicativa com mais pontos, as distribuições condicionais serão melhor determinadas.