Modelos de Equações Estruturais (SEMs) versus Redes Bayesianas (BNs)

19

A terminologia aqui é uma bagunça. A "equação estrutural" é tão vaga quanto a "ponte arquitetônica" e a "rede bayesiana" não é intrinsecamente bayesiana . Melhor ainda, a Judea Pearl , de Deus da causalidade, diz que as duas escolas de modelos são quase idênticas.

Então, quais são as diferenças importantes?

(Surpreendente para mim, a página da Wikipedia para SEMs nem sequer inclui a palavra "rede" até o momento da redação.)

zkurtz
fonte
Aqui está uma explicação sucinta do próprio Judea Pearl: causality.cs.ucla.edu/blog/index.php/2012/12/07/…
dmp
@ dmp, obrigado, essa parece ser a nova versão do meu link anteriormente quebrado acima em 'Judea Pearl' - fixado
zkurtz

Respostas:

11

Até onde eu sei, as Redes Bayesianas não afirmam ser capazes de estimar efeitos causais em gráficos acíclicos não direcionados, enquanto o SEM faz isso. Essa é uma generalização a favor do SEM ... se você acredita.

Um exemplo disso pode ser medir o declínio cognitivo entre pessoas em que a cognição é um efeito latente estimado usando um instrumento de pesquisa como o 3MSE, mas algumas pessoas podem diminuir a cognição em função do uso de analgésicos. Seus remédios para dor podem ter sido uma conseqüência de se machucar devido ao declínio cognitivo (queda, por exemplo). E assim, em uma análise transversal, você veria um gráfico que tem uma forma circular. Os analistas de SEM gostam de lidar com problemas como esse. Eu dirijo claro.

No mundo da rede Bayes, você tem métodos muito gerais para avaliar a independência / dependência condicional dos nós. Pode-se usar uma abordagem totalmente paramétrica com qualquer número de distribuições, ou seguir as abordagens não paramétricas bayesianas de que já ouvi falar. O SEM estimado usando ML é (geralmente) considerado normal, o que significa que a independência condicional é equivalente a ter covariância zero para 2 nós no gráfico. Pessoalmente, acredito que essa é uma suposição bastante forte e teria muito pouca robustez para modelar erros de especificação.

AdamO
fonte
Isso pode ser uma diferença no que os profissionais chamam de análise, mas nada força um sistema de equações estruturais a ser paramétrico. @zkurtz: Há uma discussão longa e tecnicamente detalhada sobre o que são os SEMs na causalidade de Pearl. Se você não tiver o livro, eu poderia tentar publicar um breve resumo e rastrear o exemplo a que ele se refere no link que você postou.
CloseToC
Embora seja verdade que as estimativas de covariância são consistentes para modelos de probabilidade não normais, a questão principal é a interpretação da covariância 0 como independência condicional. Em geral, isso só pode ser dito das variáveis ​​normalmente distribuídas.
Adamo
2

Eu realmente não entendo isso, mas veja aqui :

Modelos de equações estruturais e redes bayesianas parecem tão intimamente conectados que pode ser fácil esquecer as diferenças. O modelo de equações estruturais é um objeto algébrico. Enquanto o gráfico causal permanecer acíclico, as manipulações algébricas serão interpretadas como intervenções no sistema causal. A rede bayesiana é um modelo estatístico generativo que representa uma classe de distribuições de probabilidade conjunta e, como tal, não suporta manipulações algébricas. No entanto, a representação simbólica de sua fatoração de Markov é um objeto algébrico, essencialmente equivalente ao modelo de equações estruturais.

zkurtz
fonte
Especificamente, eu me pergunto o que eles querem dizer com "manipulações algébricas" neste contexto.
Zkurtz 5/03