Por que algumas fórmulas têm o coeficiente na frente na probabilidade de regressão logística e outras não?

7

Estou obtendo a probabilidade de regressão logística. Eu vi duas versões diferentes:

(1)f(y|β)=i=1Nniyi!(niyi)!πiyi(1πi)niyi

Ou isto

(2)L(β0,β1)=i=1Np(xi)yi(1p(xi))1yi

Por que existe Na equação 1?niyi!(niyi)!

Fontes:

  1. Primeiro: https://czep.net/stat/mlelr.pdf (página 3 equ. 2)
  2. Segundo: http://www.stat.cmu.edu/~cshalizi/uADA/12/lectures/ch12.pdf (página 5 equ. 12.6)

Nota: Esta pergunta não é uma duplicata do que "probabilidade é definida apenas até uma constante multiplicativa de proporcionalidade" significa na prática? Pode-se rastrear a resposta de volta à distribuição binomial, depois de ver como isso é feito. Mas ninguém saberia que a pergunta nesse post é a resposta para essa pergunta.

user13985
fonte
6
Esse fator deve estar lá, mas se você estiver procurando pelo que maximiza essa função, como o fator não depende de ele não terá influência no que você tem o máximo. A propósito, você perdeu o na segunda fórmula. βββΠ
Mesmo depois de ver a nota (e, aprofundando-me, vendo o fechamento e reabrindo), eu também teria dito que "as funções de probabilidade são definidas de acordo com a proporcionalidade" foi a resposta a essa pergunta. Aqui, não importa se você sabe a ordem das observações ou não, como eles levam a funções de verossimilhança proporcionais
Henry

Respostas:

11

O segundo é um caso especial do primeiro. Sua primeira referência discute o caso em que cada é distribuído como uma distribuição binomial com tamanho de amostra , enquanto a segunda referência assume que cada é uma variável aleatória de Bernoulli. Essa é a diferença: quando cada , .yiniyini=1niyi!(niyi)!=1

Algumas citações que apóiam isso: do 2.1.2 na primeira referência:

Como a probabilidade de sucesso de qualquer um dos ensaios é ...niπi

E a partir da primeira seção da segunda referência 12.1:

Vamos escolher uma das classes e chamar " " e a outra " " ...10

Taylor
fonte