Probabilidades de regressão logística

8

Eu construí um modelo de regressão logística em R e, embora o resultado pareça ser satisfatório até certo ponto, há uma pergunta que não consigo resolver. Não tenho certeza se minha abordagem está correta.

Eu sei que o objetivo geral do modelo logístico é prever a probabilidade de sucesso de uma variável aleatória binária. Do mesmo modelo logístico é possível conhecer a probabilidade para uma dada proporção? Digamos, por exemplo, que estamos interessados ​​em calcular a probabilidade de ser admitido em uma escola e usamos uma regressão logística para estimar essa probabilidade, que obviamente depende de algumas variáveis ​​independentes. Minha pergunta é com o mesmo modelo, é possível estimar a proporção de alunos que serão admitidos nessa escola em particular?

Eu tentei usar a probabilidade binomial para responder a isso, mas por algum motivo isso não me dá a resposta certa. Como eu fui sobre isso. Se sabemos a probabilidade de sucesso, também sabemos que a variável Dependente segue uma Distribuição Binomial com o Parâmetro N e P, onde N é o Número de tentativas e P é a probabilidade de sucesso que pode ser estimada a partir do modelo logístico. Portanto, se eu quero a probabilidade de que a proporção seja menor ou igual a dizer p, pensei que isso equivale à probabilidade de que em N ensaios haja N * p sucesso menor ou igual, com probabilidade de sucesso P.

PS: Sei que a probabilidade de sucesso é uma taxa / proporção geral, mas o que me interessa é descobrir a probabilidade de um determinado grupo. A característica do grupo poderia ser incluída no modelo, mas isso seria limitador no meu caso. Na verdade, estou mais interessado em encontrar a probabilidade de uma proporção do modelo logístico do que o sucesso de um determinado grupo.

obrigado

ThinkStatsme
fonte
7
Se entendi essa pergunta, ela pergunta como usar um modelo logístico para estimar a distribuição do número de alunos admitidos em um grupo específico de candidatos. Esse resultado pode ser obtido , mas se você estiver interessado em aplicá-lo, poderá ajudar a considerar algumas das suposições que podem ser violadas. Em particular, a computação desse resultado deve assumir que a admissão de uma pessoa não afetará as chances de admissão de outras. Se a escola tiver uma cota para certos tipos de candidatos, esse não será o caso, por exemplo.
whuber
@whuber, em parte quero estimar o número de estudantes admitidos em um grupo específico de candidatos. Também de maior interesse, embora eu não o tenha formulado corretamente, é possível atribuir uma probabilidade na estimativa da taxa de sucesso média a partir do modelo logístico. Por exemplo, se o sucesso estimado de um caso é de 85%, existe alguma maneira de descobrir a probabilidade de que isso possa ser inferior a 60%? Faz sentido agora? Pensei que talvez pudesse usar o erro padrão na previsão para responder a isso, isso seria correto?
ThinkStatsme

Respostas:

1

Se entendi sua pergunta corretamente, você previu a probabilidade de cada indivíduo, mas deseja saber a probabilidade média de um segmento desses indivíduos? Por exemplo, você tem 1000 indivíduos com uma taxa média de 65%, mas apenas 300 têm olhos azuis, qual é a taxa média daqueles com olhos azuis? Então você pode simplesmente calcular a média de suas probabilidades estimadas para aqueles com olhos azuis.

Josh
fonte