Modelos generativos versus discriminativos (no contexto bayesiano)

22

Quais são as diferenças entre os modelos generativo e discriminativo (discriminante) (no contexto da aprendizagem e inferência bayesiana)?

e o que diz respeito à previsão, teoria da decisão ou aprendizado não supervisionado?

nkint
fonte
Desculpe, não entendo o que você quer dizer com a segunda frase. Você tentaria reformulá-lo?
csgillespie
Oh, acabei de ingressar no mundo da estatística e do aprendizado de máquina. Desculpe por não descobrir como vincular o aprendizado não supervisionado à teoria da decisão. mas ainda estou estudando!
Nkint 19/11/10
1
Estou confuso como isso se encaixa na pergunta. Por exemplo, as palavras "previsão", "teoria da decisão" ou "não supervisionado" não aparecem na resposta aceita
csgillespie

Respostas:

35

Ambos são usados ​​no aprendizado supervisionado, no qual você deseja aprender uma regra que mapeia a entrada x para a saída y, dados vários exemplos de treinamento no formato . Um modelo generativo (por exemplo, Bayes ingênuo) modela explicitamente a distribuição de probabilidade conjunta p ( x , y ) e, em seguida, usa a regra de Bayes para calcular p ( y | x ) . Por outro lado, um modelo discriminativo (por exemplo, regressão logística) modela diretamente p ( y | x ) .{(xEu,yEu)}p(x,y)p(y|x)p(y|x)

(y)p(x|y)

Pode haver casos em que um modelo é melhor que o outro (por exemplo, modelos discriminativos costumam se sair melhor se você tiver muitos dados; modelos generativos podem ser melhores se você tiver alguns dados extras não rotulados). De fato, também existem modelos hybird que tentam trazer o melhor dos dois mundos. Veja este documento para um exemplo: Híbridos de princípios de modelos generativos e discriminativos

ebony1
fonte
1
Boa resposta. Com relação à comparação de exemplos canônicos de classificadores discriminativos versus geradores (regressão logística e Bayes ingênuo gaussiano, respectivamente), achei este capítulo do livro muito acessível que o Ng: cs.cmu.edu/~tom/mlbook/NBayesLogReg.pdf
Josh Hemann
3

Uma adição à resposta acima:

Como os discriminantes cuidam apenas de P (Y | X), enquanto os generativos cuidam de P (X, Y) e P (X) ao mesmo tempo, para prever bem P (Y | X), o modelo generativo tem menos grau de liberdade no modelo comparado ao modelo discriminante. Portanto, o modelo generativo é mais robusto , menos propenso a sobreajuste, enquanto o discriminante é o contrário.

Isso explica a resposta acima

Pode haver casos em que um modelo é melhor que o outro (por exemplo, modelos discriminativos costumam se sair melhor se você tiver muitos dados; modelos generativos podem ser melhores se você tiver alguns dados extras não rotulados).

ArtificiallyIntelligence
fonte
2
Você pode explicar o que está dizendo sobre o fato de os modelos generativos terem menos graus de liberdade? Prova? Links? Obrigado
Patrick