Rede bayesiana vs. regras de associação

7

O algoritmo Apriori encontra algumas regras de implicação.

Resultados semelhantes são fornecidos pelas redes bayesianas.

Qual é a diferença essencial? Quais são as vantagens / desvantagens específicas?

Edit: O Apriori Algorithm gera regras de atribuição como um tipo de implicação, como pode ser visualmente inspecionado na figura a seguir (tirada deste artigo ). insira a descrição da imagem aqui

Karel Macek
fonte

Respostas:

5

Essa pergunta é semelhante à pergunta: qual é a diferença entre modelos paramétricos e não paramétricos.

  • A rede bayesiana pode ser vista como modelo paramétrico. Onde temos suposições explícitas sobre variáveis ​​aleatórias e dependências entre variáveis ​​aleatórias (supondo que apenas fazemos aprendizado de parâmetros, não aprendemos estrutura).

  • O algoritmo Apriori é um tipo de algoritmo de "mineração de dados", o que significa que fornecerá todos os padrões com um algoritmo eficaz, não realmente "aprendizado de máquina", isto é, aprender / ajustar certos parâmetros para otimizar determinada função objetivo.

  • Qual é melhor? ou prós e contras? assim como a discussão sobre o modelo paramétrico vs. modelo não paramétrico. Se as suposições da rede bayesiana forem boas, será "melhor". Por outro lado, se as suposições não forem precisas, apriori pode ser melhor.


Além disso, a rede bayesiana e o algoritmo Apriori são usados ​​de maneira diferente.

  • Redes Bayesianas são usadas principalmente para "inferência". As perguntas que podemos fazer à Rede Bayesiana são como "Se eu sei que A e B aconteceram, qual é a chance de C acontecer e D não acontecer"? O modelo fornecerá probabilidades da consulta.

  • O algoritmo Apriori é usado para obter itens frequentes que satisfazem a condição. A pergunta típica feita seria "quais são os itens frequentes", que é diferente da consulta de probabilidade condicional mencionada nas Redes Bayesianas.

  • Informalmente, podemos pensar que a Apriori está tentando fazer perguntas sobre probabilidade conjunta e armazenar todas as combinações de alta frequência. Por outro lado, a rede bayesiana está tentando fazer perguntas sobre probabilidade condicional: dados os dados, qual hipótese é mais provável.

Haitao Du
fonte
Obrigado pela sua resposta. Ainda assim, a priori minas também regras A-> B que podem ser entendidas como probabilidade "condicional".
Karel Macek #
@KarelMacek Eu discordo. AB vem junto (articulação) é totalmente diferente Dado A, B irá ocorrer (Condicional)
Haitao Du
Eu estendi a pergunta. Apriori é usado também para mineração de regras condicionais.
Karel Macek
@ hxd1011 Boas respostas e comparação. Mas eu discordo de seus comentários. P (A, B) / P (A) é exatamente P (B | A).
Diansheng