Para um problema de regressão logística bayesiana, criei uma distribuição preditiva posterior. Eu coleciono amostras da distribuição preditiva e recebo milhares de amostras de (0,1) para cada observação que tenho. Visualizar a qualidade do ajuste é menos do que interessante, por exemplo:
Este gráfico mostra as 10.000 amostras + o ponto de referência observado (na esquerda, é possível distinguir uma linha vermelha: sim, essa é a observação). O problema é que esse gráfico é pouco informativo e terei 23 deles, um para cada ponto de dados.
Existe uma maneira melhor de visualizar os 23 pontos de dados e amostras posteriores?
Outra tentativa:
Outra tentativa baseada no artigo aqui
bayesian
data-visualization
classification
goodness-of-fit
binary-data
Cam.Davidson.Pilon
fonte
fonte
Respostas:
Sinto que você não está desistindo de todos os bens da sua situação, mas, considerando o que temos diante de nós, vamos considerar a utilidade de um simples gráfico de pontos para exibir as informações.
A única coisa real que não está aqui (que talvez não seja o comportamento padrão) é:
A classificação é o verdadeiro incentivo para gráficos de pontos como esses. A classificação por valores de proporção aqui ajuda a descobrir facilmente observações residuais altas. Ter um sistema em que você possa classificar facilmente por valores contidos na plotagem ou em características externas dos casos é a melhor maneira de obter o retorno do investimento.
Este conselho também se estende a observações contínuas. Você pode colorir / modelar os pontos de acordo com o resíduo negativo ou positivo e, em seguida, dimensionar o ponto de acordo com o resíduo absoluto (ou quadrado). Aqui, o IMO não é necessário devido à simplicidade dos valores observados.
fonte
A maneira usual de visualizar o ajuste de um modelo de regressão logística bayesiano com um preditor é traçar a distribuição preditiva junto com as proporções correspondentes. (Por favor, deixe-me saber se eu entendi sua pergunta)
Um exemplo usando o popular conjunto de dados Bliss.
Código Abaixo em R:
fonte
ni = 23
eno = 7
e cada um dos 23 indivíduos tem um diferentedose
. Porém, você pode fazer um gráfico semelhante para os dados do OP (os pontos são colocados em 0 ou 1 no eixo Y e você plota a função). Veja alguns exemplos de gráficos semelhantes para regressão logística nas referências que dou nesta resposta .Estou respondendo a uma solicitação de técnicas gráficas alternativas que mostram como os eventos de falha simulados correspondem aos eventos de falha observados. A questão surgiu em "Programação Probabilística e Métodos Bayesianos para Hackers", encontrada aqui . Aqui está minha abordagem gráfica:
Código encontrado aqui .
fonte