Qual é a diferença entre regressão binomial e regressão logística?

20

Eu sempre pensei em regressão logística como simplesmente um caso especial de regressão binomial em que a função link é a função logística (em vez de, digamos, uma função probit).

Ao ler as respostas de outra pergunta que tive, parece que posso estar confuso, e há uma diferença entre regressão logística e regressão binomial com um link logístico.

Qual é a diferença?

raegtin
fonte

Respostas:

13

A regressão logística é uma regressão binomial com a função de link "logística":

g(p)=log(p1p)=Xβ

Embora eu também pense que a regressão logística é geralmente aplicada a proporções binomiais e não a contagens binomiais.

probabilityislogic
fonte
1
O que você quer dizer com regressão logística sendo geralmente aplicada a proporções e não a contagens? Suponha que eu esteja tentando prever se as pessoas comparecerão a uma festa ou não, e que para uma festa específica, eu sei que 9 pessoas compareceram e 1 não - você quer dizer que a regressão logística leva isso como um exemplo de treinamento (por exemplo, essa parte teve uma taxa de sucesso de 0,9), enquanto a regressão binomial com um link levaria isso como 10 exemplos de treinamento (9 sucessos, 1 falha)?
raegtin
@raehtin - em ambos os casos, seria amostra / caso de treinamento, com e respectivamente. A diferença é a forma das funções de média e variância. Para binomial, a média é , o link canoncial agora é (também chamado de "parâmetro natural"), e a função de variação é com parâmetro de dispersão . Para logística, temos a média , o link acima, função de variância de e dispersão igual a .1(ni,fi)=(10,0.9)(ni,xi)=(10,9)μi=nipilog(μiniμi)V(μi)=μi(niμi)niϕi=1μi=piV(μi)=μi(1μi)ϕi=1ni
probabilityislogic
Com logística, o é separado a partir das funções de média e variância, por isso podem ser mais facilmente tomadas em conta por meio da ponderaçãoni
probabilityislogic
Ah, entendi, eu acho que eu vejo. Isso significa que eles produzem resultados equivalentes (simplesmente obtidos de uma maneira diferente)?
21411 raegtin
1
@raegtin - acho que sim. Os pesos GLM, , são iguais nos dois casos, e a função de link produz o mesmo valor de logit. Portanto, desde que as variáveis ​​X também sejam as mesmas, deverá fornecer os mesmos resultados. wi2=1ϕiV(μi)[g(μi)]2
probabilityislogic
4

Regressão binomial é qualquer tipo de GLM usando uma relação de variação média binomial em que a variação é dada por . Na regressão logística, com a função logit considerada uma função "link". No entanto, uma classe geral de modelos de regressão binomial pode ser definida com qualquer tipo de função de link, até mesmo funções com saída fora de . Por exemplo, a regressão probit usa um link do CDF normal inverso, a regressão de risco relativo usa como link a função log e os modelos de risco aditivos usam o modelo de link de identidade.var(Y)=Y^(1Y^)Y^=logit1(Xβ^)=1/(1exp(Xβ^))[0,1]

AdamO
fonte