Estou tentando entender o uso da regressão logística nas tabelas de contingência 2x2 e ix2. Por exemplo, usando isso como um exemplo
Qual é a diferença entre usar o teste qui-quadrado e usar regressão logística? Que tal uma tabela com vários fatores nominais (tabela Ix2) como esta:
Existe uma pergunta semelhante aqui - mas a resposta é principalmente que o qui-quadrado pode lidar com tabelas mxn, mas minha pergunta é o que é específico para alquilo quando há um resultado binário e um único fator nominal. (O encadeamento vinculado também se refere a esse encadeamento , mas isso diz respeito a variáveis / fatores múltiplos).
Se é apenas um único fator (ou seja, não é necessário controlar outras variáveis) com uma resposta binária, qual é a diferença de objetivo de fazer regressão logística?
fonte
Respostas:
Por fim, são maçãs e laranjas.
A regressão logística é uma maneira de modelar uma variável nominal como um resultado probabilístico de uma ou mais outras variáveis. O ajuste de um modelo de regressão logística pode ser seguido com o teste de se os coeficientes do modelo são significativamente diferentes de 0, calculando intervalos de confiança para os coeficientes ou examinando até que ponto o modelo pode prever novas observações.
O teste do χ² de independência é um teste de significância específico que testa a hipótese nula de que duas variáveis nominais são independentes.
Se você deve usar regressão logística ou um teste de χ² depende da pergunta que você deseja responder. Por exemplo, um teste de χ² pode verificar se não é razoável acreditar que o partido político registrado de uma pessoa é independente de sua raça, enquanto a regressão logística pode calcular a probabilidade de uma pessoa com uma determinada raça, idade e sexo pertencer a cada partido político .
fonte