Embora eu tenha feito alguma programação com máquinas de Boltzmann em uma aula de física, não estou familiarizado com a caracterização teórica deles. Por outro lado, conheço um pouco da teoria dos modelos gráficos (sobre os primeiros capítulos do livro de Lauritzen, Graphical Models ).
Pergunta: Existe alguma relação significativa entre os modelos gráficos e a máquina de Boltzmann? A máquina Boltzmann é um tipo de modelo gráfico?
Obviamente, a máquina Boltzmann é um tipo de rede neural. Ouvi dizer que algumas redes neurais estão matematicamente relacionadas a modelos gráficos e que outras não.
Perguntas relacionadas no CrossValidated que não respondem à minha pergunta:
Isso é semelhante a uma pergunta anterior que foi feita antes: Qual é a relação entre modelos hierárquicos, redes neurais, modelos gráficos, redes bayesianas? mas é mais específico.
Além disso, a resposta aceita para essa pergunta não esclarece minha confusão - mesmo que os nós na representação gráfica padrão de uma rede neural não representem variáveis aleatórias, isso não significa necessariamente que essa representação não existe. Especificamente, estou pensando em como os nós na representação gráfica típica das cadeias de Markov representam o conjunto de estados possíveis, e não as variáveis aleatórias , mas também é possível criar um gráfico mostrando as relações de dependência condicional entre osX i, que mostra que toda cadeia de Markov é de fato um campo aleatório de Markov. A resposta também diz que as redes neurais (presumivelmente incluindo as máquinas de Boltzmann) são "discriminatórias", mas não entram em mais detalhes para explicar o que essa afirmação significa, nem a pergunta óbvia de acompanhamento "os modelos gráficos não são discriminatórios?" endereçado. Da mesma forma, a resposta aceita está no site de Kevin Murphy (na verdade, li algumas de suas teses de doutorado ao aprender sobre redes bayesianas), mas este site discute apenas redes bayesianas e não menciona redes neurais - portanto, deixa de esclarecer como elas são diferentes.
Essa outra pergunta provavelmente é mais parecida com a minha: modelando matematicamente redes neurais como modelos gráficos No entanto, nenhuma das respostas foi aceita e da mesma forma apenas fornece referências, mas não as explica (por exemplo, esta resposta ). Embora um dia eu seja capaz de entender as referências, agora estou em um nível básico de conhecimento e gostaria muito de receber uma resposta o mais simplificada possível. Além disso, o curso de Toronto vinculado na resposta superior ( http://www.cs.toronto.edu/~tijmen/csc321/lecture_notes.shtml ) aborda isso, mas não com muitos detalhes. Além disso, as notas da palestra que pode responder à minha pergunta não estão disponíveis ao público.
25 de março Aula 13b: Redes de Crenças 7:43. Para este slide, lembre-se das máquinas Boltzmann. Lá também temos unidades ocultas e visíveis, e é tudo probabilístico. BMs e SBNs têm mais em comum do que diferenças. 9:16. Atualmente, "Modelos Gráficos" são às vezes considerados como uma categoria especial de redes neurais, mas na história descrita aqui, eles eram considerados tipos muito diferentes de sistemas.
Isso apenas confirma / verifica a resposta aceita, que as máquinas Boltzmann são realmente um caso especial de modelo gráfico. Especificamente, esta questão é abordada nas páginas 127-127 de Koller, Friedman, Modelos Gráficos Probabilísticos: Princípios e Técnicas , na Caixa 4.C.
Como o modelo de Ising, originalmente um conceito da literatura da mecânica estatística, pode ser formulado como um modelo gráfico, é fornecido em muitos detalhes no Exemplo 3.1., Seção 3.3., Nas páginas 41-43 de Wainwright, Jordan, Modelos Gráficos, Exponencial Famílias e inferência variacional .
Aparentemente, o modelo de Ising foi fundamental para a fundação do campo dos modelos gráficos no final dos anos 70 e início dos anos 80, pelo menos com base no que Steffen Lauritzen diz no prefácio e na introdução de seu livro, Modelos Gráficos . Essa interpretação também parece apoiada na Seção 4.8 do livro acima citado por Koller e Friedman.
O desenvolvimento de máquinas Boltzmann a partir do modelo Ising pode ter sido uma ocorrência independente, com base na mesma seção de Koller e Friedman, que afirma que "as máquinas Boltzmann foram propostas pela primeira vez por Hinton e Sejnowski (1983)", o que parece ter ocorreu após o trabalho inicial no desenvolvimento de campos aleatórios de Markov como generalizações do modelo de Ising, embora o trabalho por trás desse artigo pudesse ter começado muito antes de 1983.
Minha confusão sobre esse relacionamento, quando escrevi essa pergunta há mais de um ano, surgiu do fato de eu ter encontrado pela primeira vez tanto o modelo de Ising quanto o modelo de máquina de Boltzmann para neurônios, na literatura de física. Como Koller e Friedman mencionam, a literatura dentro da comunidade de física estatística sobre o modelo de Ising e noções relacionadas é realmente vasta.
Na minha experiência, também é bastante insular, no sentido de que, enquanto estatísticos e cientistas da computação estudando modelos gráficos mencionam como o campo está relacionado à mecânica estatística, nenhuma referência que eu já encontrei na literatura de física estatística menciona as conexões com outros campos ou tenta explorá-lo. (Daí me fazer duvidar e ficar confuso com a noção de que poderia haver essas conexões com outros campos.)
Para um exemplo da perspectiva do físico, tanto no modelo de Ising quanto na máquina de Boltzmann, consulte o livro do curso em que o aprendi pela primeira vez. Também menciona métodos médios de campo, se bem me lembro, algo discutido também no artigo de Jordan e Wainwright citado acima.
fonte