Diferença entre rede Bayes, rede neural, árvore de decisão e redes de Petri

30

Qual é a diferença entre rede neural , rede bayesiana , árvore de decisão e redes de Petri , mesmo que todos sejam modelos gráficos e representem visualmente a relação causa-efeito.

Ria George
fonte
1
Observe que também existem redes neurais bayesianas (apenas para confundir), que são basicamente apenas uma rede neural com um tratamento bayesiano de parâmetros, tanto quanto eu posso ver.
precisa saber é o seguinte

Respostas:

27

Uau, que grande questão! A versão curta da resposta é que, apenas porque você pode representar dois modelos usando representações visuais diagramaticamente semelhantes, não significa que eles estejam remotamente relacionados estruturalmente, funcionalmente ou filosoficamente. Não estou familiarizado com FCM ou NF, mas posso falar um pouco com os outros.

Rede Bayesiana

Em uma rede bayesiana, o gráfico representa as dependências condicionais de diferentes variáveis ​​no modelo. Cada nó representa uma variável e cada aresta direcionada representa um relacionamento condicional. Essencialmente, o modelo gráfico é uma visualização da regra da cadeia.

Rede neural

Em uma rede neural, cada nó é um "neurônio" simulado. O neurônio é essencialmente ativado ou desativado, e sua ativação é determinada por uma combinação linear dos valores de cada saída na "camada" anterior da rede.

Árvore de decisão

Digamos que estamos usando uma árvore de decisão para classificação. A árvore nos fornece essencialmente um fluxograma descrevendo como devemos classificar uma observação. Começamos pela raiz da árvore e a folha onde terminamos determina a classificação que previmos.

Como você pode ver, esses três modelos realmente não têm nada a ver um com o outro, além de serem representáveis ​​com caixas e setas.

David Marx
fonte
1
Teoria à parte, a árvore de decisão também não está lidando com dependências entre variáveis ​​cuspindo dados? Eu sou novo no campo de aprendizado de máquina e estou mais interessado em entender intuitivamente que algo usar em qual cenário. Para mim, parece que você usaria a rede bayesiana quando conhecer a relação exata entre variáveis, enquanto usaria a árvore de decisão quando achar que algumas variáveis ​​podem depender de outras, mas não sabem exatamente quais. Gostaria de saber se isso parece correto ou se a aplicabilidade da rede bayesiana e as árvores de decisão podem ser explicadas em mais detalhes.
Deepak Agarwal
Eu realmente acho que a resposta deve apontar para diferenças e semelhanças para esboçar o quadro geral, afirmando que "esses três modelos realmente não têm nada a ver um com o outro" está errado. A Árvore de Decisão e as Redes Neurais adotam a mesma abordagem discriminativa, em comparação com a abordagem generativa do BN. Enquanto os outros dois representam funções, Bayesian Networks representam funções generalizadas (distribuições), ...
Lejafar
1
A distinção descriminativa x generativa que você está fazendo aqui está errada. Redes neurais podem ser usadas para construir modelos generativos. Considere GANs, por exemplo. Minha resposta é suficiente porque a pergunta se resume a "esses modelos são representados visualmente de uma maneira semelhante, isso significa que eles são estruturalmente semelhantes?" e expliquei como essas representações gráficas estão codificando informações muito diferentes.
David Marx
1
Sinta-se livre para adicionar sua própria resposta.
David Marx
2
@Lejafar, não use edições para alterar o conteúdo da resposta de outra pessoa. Se você não concordar com uma resposta, deixe um comentário, faça voto negativo ou publique sua própria resposta.
gung - Restabelece Monica
5

É fácil mostrar (consulte o curso de Daphne Koller ) que a Regressão Logística é uma versão restrita dos Campos Aleatórios Condicionais, que são modelos gráficos não direcionados, enquanto as Redes Bayesianas são modelos gráficos direcionados. Então, a regressão logística também pode ser vista como um perceptron de camada única. Este é o único link (que é muito flexível) que eu acho que poderia ser traçado entre as Redes Bayesianas e as Redes Neurais.

Ainda não encontrei um link entre os outros conceitos sobre os quais você perguntou.

Octavia-Maria Șulea
fonte
2
Bem-vindo ao site e obrigado por esta contribuição. Você pode explicar como é fácil ver isso? No momento, essa é apenas uma afirmação que pode não ser óbvia para as pessoas. As informações podem estar no link, mas queremos que este tópico permaneça informativo, mesmo depois que o link se esgotar.
gung - Restabelece Monica
Oi e obrigado! Não tenho certeza de quão detalhada deve ser a explicação (leva Daphne pelo menos meia hora para preparar a prova) e também não é particularmente fresco em minha mente, mas a idéia geral é que o modelo logístico é uma versão simplificada de a Distribuição Gibbs, que por sua vez é a base dos CRFs.
Octavia-Maria Șulea
1
O que significa crf? Crf = campos aleatórios condicionais?
Ted Taylor da vida
2

Excelente resposta de @David Marx. No entanto, a maioria das empresas que utilizam este tipo de serviço são aquelas que possuem um sistema de gerenciamento de energia, que é o sistema de distribuição de energia elétrica mais utilizado no mundo, por isso, é fundamental que você consiga calcular a quantidade de energia necessária para o seu funcionamento.

Sinto que a metodologia de construção da rede bayesiana é diferente em comparação com a árvore Regressão / Decisão. O algoritmo para aprendizado estrutural, os objetivos para o uso dos modelos e a capacidade inferencial dos modelos são diferentes.

A abordagem baseada em pontuação e restrita pode ser entendida com alguns paralelos traçados com os critérios de ganho de informações nas famílias da árvore de decisão.

KarthikS
fonte
1

Primeiro, tentamos declarar a natureza do problema tentado ser resolvido por esses métodos. Se um problema for direto, Polynomial ou NP Complete, estamos prontos para conectar algoritmos que poderiam fornecer uma resposta determinística, pela simples recombinação dos axiomas de acordo com as regras lógicas. No entanto, se esse não for o caso, teríamos que confiar em um método de raciocínio, em que tentamos tratar o problema como heterogêneo e conectá-lo a uma rede, os nós sendo avaliações e as bordas como caminhos entre os componentes .

Em qualquer tipo de raciocínio baseado em rede, não raciocinamos dedutivamente, usando generalizações e combinações abstratas, de acordo com regras lógicas em um fluxo linear, mas resolvemos o problema com base na propagação do raciocínio em diferentes direções, para resolvermos o problema, um nó de cada vez, aberto a melhorias na descoberta de novos fatos sobre qualquer nó no futuro. Agora vamos ver como cada uma dessas técnicas aborda esse método de solução de problemas à sua maneira.

Rede Neural: A rede Neural é uma caixa preta, onde se acredita (nunca foi possível verificar de fora do sistema) que as conexões entre os nós simplórios são formadas e enfatizadas por repetidos reforços externos. Aborda o problema em um paradigma de Connectionsitic . O problema provavelmente está resolvido, mas há pouca explicação. A rede neural agora é amplamente utilizada devido à sua capacidade de produzir resultados rápidos, se o problema da explicabilidade for negligenciado.

Rede Bayesiana: A Rede Bayesiana é um gráfico acíclico direcionado, que mais se parece com o fluxograma, apenas que o fluxograma pode ter ciclos cíclicos. A rede bayesiana, diferente do fluxograma, pode ter vários pontos de partida. Ele basicamente rastreia a propagação de eventos em vários pontos ambíguos, onde o evento diverge probabilisticamente entre os caminhos. Obviamente, em qualquer ponto da rede, a probabilidade desse nó ser visitado depende da probabilidade conjunta dos nós anteriores. A rede bayesiana é diferente da rede neural, pois é um raciocínio explícito, embora probabilístico e, portanto, possa ter vários estados estáveis ​​com base em cada etapa sendo revisitada e modificada dentro de valores legais, como um algoritmo. É uma maneira robusta de raciocinar probabilisticamente, mas envolve a codificação de probabilidades,

Árvores de decisão: A árvore de decisão é novamente uma rede, mais parecida com um fluxograma, mais próxima da rede bayesiana do que da rede neural. Cada nó tem mais inteligência do que a rede neural e a ramificação pode ser decidida por avaliações matemáticas ou probabilísticas. As decisões são avaliações diretas baseadas na distribuição de frequências de eventos prováveis, onde a decisão é probabilística. No entanto, nas redes bayesianas, a decisão é baseada na distribuição de 'evidências' que apontam para a ocorrência de um evento, e não na observação direta do próprio evento.

Um exemplo Por exemplo, se formos prever o movimento de um tigre devorador de homens através de algumas aldeias do Himalaia que, por acaso, fica na borda de alguma reserva de tigres, poderíamos modelá-lo em qualquer uma das seguintes abordagens:

Em uma árvore de decisão, confiaríamos em estimativas de especialistas se um tigre teria a opção entre campos abertos ou rios escolheria neste último. Em uma rede bayesiana, rastreamos o tigre por marcas de pug, mas raciocina de uma maneira que reconhece que essas marcas de pug podem ter sido as de algum outro tigre de tamanho semelhante que patrulha rotineiramente seu território. Se quisermos usar uma rede neural, teríamos que treinar o modelo repetidamente, usando várias peculiaridades comportamentais do tigre em geral, como sua preferência por nadar, preferência por áreas cobertas em vez de áreas abertas, evitando as habitações humanas para permita que a rede raciocine geralmente ao longo do curso que o tigre possa seguir.

premganz
fonte
0

Em relação aos modelos gráficos, a Petri Net formaliza o comportamento do sistema; na medida em que difere bastante do restante dos modelos mencionados, todos relacionados à forma como um julgamento é formado.

Vale ressaltar que a maioria dos nomes citados designa conceitos bastante amplos de IA, que geralmente se fundem: por exemplo, você pode usar uma Rede Neural para construir uma árvore de decisão, enquanto a própria Rede Neural, como um post anterior discutido, pode depender de informações bayesianas. inferência.

user46748
fonte
-3

É uma boa pergunta e eu tenho me perguntado o mesmo. Existem mais de dois tipos de redes neurais, e parece que a resposta anterior abordou o tipo competitivo, enquanto a rede bayesiana parece ter semelhanças com o tipo feed-forward, back-propagation (FFBP), e não o tipo competitivo. Na verdade, eu diria que a rede bayesiana é uma generalização do FFBP. Portanto, o FFBP é um tipo de rede bayesiana e funciona de maneira semelhante.

user73493
fonte