Fiz uma regressão linear de aceitação na faculdade contra as pontuações do SAT e a família / origem étnica. Os dados são fictícios. Este é um acompanhamento de uma pergunta anterior, já respondida. A questão se concentra na coleta e interpretação de odds ratio ao deixar as pontuações do SAT de lado por simplicidade.
As variáveis são Accepted
(0 ou 1) e Background
("vermelho" ou "azul"). Configurei os dados para que as pessoas de fundo "vermelho" tivessem mais probabilidade de entrar:
fit <- glm(Accepted~Background, data=dat, family="binomial")
exp(cbind(Odds_Ratio_RedvBlue=coef(fit), confint(fit)))
Odds_Ratio_RedvBlue 2.5 % 97.5 %
(Intercept) 0.7088608 0.5553459 0.9017961
Backgroundred 2.4480042 1.7397640 3.4595454
Questões:
0,7 é a proporção ímpar de uma pessoa de fundo "azul" sendo aceita? Estou perguntando isso porque também recebo 0,7 para "
Backgroundblue
" se, em vez disso, executar o seguinte código:fit <- glm(Accepted~Background-1, data=dat, family="binomial") exp(cbind(OR=coef(fit), confint(fit)))
Caso não o odds ratio de "vermelho" a ser aceites ( ) apenas a recíproca: ( S d d s B l u e = 1 / O d d s R e d )?
fonte
R
chama explicitamente os coeficientes (através da funçãocoef
) que você está chamando de "odds ratio" em sua saída. Isso sugere que você pode revisar a distinção entre os dois.Respostas:
Eu tenho trabalhado para responder minha pergunta calculando manualmente as probabilidades e os índices de chances:
Portanto, a razão de chances de entrar na escola de vermelho sobre azul é:
E este é o
Backgroundred
retorno de:(Intercept)
Se, em vez disso, eu corro:
Os retornos são precisamente as chances de ser 'azul':
Backgroundblue
(0,7089) e as chances de ser aceito como 'vermelho':Backgroundred
(1,7353). Não há Odds Ratio lá. Portanto, não se espera que os dois valores de retorno sejam recíprocos.Finalmente, como ler os resultados se houver três fatores no regressor categórico?
Mesmo cálculo manual versus [R]:
Criei um conjunto de dados fictícios diferente com a mesma premissa, mas desta vez havia três origens étnicas: "vermelho", "azul" e "laranja" e executei a mesma sequência:
Primeiro, a tabela de contingência:
E calculou as chances de entrar para cada grupo étnico:
Bem como os diferentes Odds Ratios :
E prosseguiu com a regressão logística agora rotineira seguida pela exponenciação dos coeficientes:
Obtendo as chances de entrar para "blues" como o
(Intercept)
, e as Odds Ratios de Orange versus Blue inBackgroundorange
, e o OR de Red v Blue inBackgroundred
.Por outro lado, a regressão sem interceptação retornou previsivelmente apenas as três probabilidades independentes :
fonte