Modelos probabilísticos para mínimos quadrados parciais, regressão de classificação reduzida e análise de correlação canônica?

7

Esta questão resulta da discussão que se segue a uma pergunta anterior: Qual é a conexão entre mínimos quadrados parciais, regressão de classificação reduzida e regressão de componentes principais?

Para a análise de componentes principais, um modelo probabilístico comumente usado é

x=λwz+ϵRp,
que zN(0,1) , wSp1 , λ>0 e ϵN(0,Ip) . A covariância populacional de x é λwwT+Ip , ou seja,
xN(0,λwwT+Ip).
O objetivo é estimar w. Isso é conhecido como modelo de covariância cravada, que é frequentemente usado na literatura da PCA. O problema de estimar o verdadeiro w pode ser resolvido maximizando Var(Xw) sobre w na esfera da unidade.

Conforme apontado na resposta à pergunta anterior de @amoeba, a regressão de classificação reduzida, os mínimos quadrados parciais e a análise de correlação canônica têm formulações estreitamente relacionadas,

PCA:Var(Xw),RRR:Var(Xw)Corr2(Xw,Yv)Var(Yv),PLS:Var(Xw)Corr2(Xw,Yv)Var(Yv)=Cov2(Xw,Yv),CCA:Var(Xw)Corr2(Xw,Yv).

A questão é: quais são os modelos probabilísticos por trás do RRR, PLS e CCA? Em particular, estou pensando emComo depende de e em RRR, PLS e CCA? Além disso, existe um modelo probabilístico unificado (como o modelo de covariância cravada para PCA) para eles?

(xT,yT)TN(0,Σ).
Σwv
Minkov
fonte
Olá @Moskowitz. Minha resposta está indo na direção que você esperava? Percebo que ela não responde totalmente à sua pergunta, mas ficaria feliz em receber algum feedback e também interessado em saber sua opinião sobre o assunto. Eu poderia estender minha descrição do PCCA, se você quiser; "PPLS" inexistente é algo em que venho pensando há alguns anos e me pego pensando novamente. Então, seria curioso ouvir seus pensamentos sobre isso.
Ameba
Oi @amoeba. Muito obrigado pela resposta. Desculpe pelo atraso na resposta. Eu estive pensando em visualizar o PPLS como outro modelo de exibição múltipla, onde as duas variáveis ​​x têm distribuições diferentes, mas não foram bem-sucedidas. Vou tentar adicionar a sua resposta se eu posso descobrir;)
Minkov

Respostas:

6

A análise de correlação canônica probabilística (CCA probabilística, PCCA) foi introduzida em Bach & Jordan, 2005, Uma interpretação probabilística da análise de correlação canônica , vários anos após Tipping & Bishop apresentarem sua análise probabilística de componentes principais (PCA probabilística, PPCA).

Resumidamente, é baseado no seguinte modelo probabilístico:

zN(0,I)x|zN(Wxz+μx,Ψx)y|zN(Wyz+μy,Ψy)

Aqui covariâncias de ruído e são matrizes simétricas arbitrárias de classificação completa.ΨxΨy

Modelo gráfico PCCA

Se considerarmos a variável latente unidimensional , suponha que todas as médias sejam zero e combine e em um vetor, obtemos:zμx=μy=0xy

(xy)N(0,Σ),Σ=(wxwx+Ψxwxwywywxwywy+Ψy).

Bach & Jordan provaram que isso é equivalente ao CCA padrão. Especificamente, a solução de máxima verossimilhança (ML) é dada por onde são matrizes de covariância de amostra de ambos os conjuntos de dados, é o primeiro par de eixos canônicos e são arbitrários números (ambos entre e ), dando a primeira correlação canônica como um produto.

wi=Σiuimi,
Σiuimxmy=ρ101

Como você vê, não são diretamente iguais aos eixos do CCA, mas são dados por alguma transformação desses. Veja Bach & Jordan para mais detalhes.wi


Não tenho uma boa compreensão intuitiva do PCCA. Como você pode ver, a matriz de covariância cruzada entre e é modelada por , portanto, pode-se esperar ingenuamente que produza eixos PLS. A solução ML está, no entanto, relacionada aos eixos CCA. Provavelmente, isso se deve à estrutura diagonal do bloco de .XYwxwywiΨ=(Ψx00Ψy)

Não conheço nenhuma versão probabilística semelhante de RRR ou PLS e não consegui me apresentar a nenhuma delas. Observe que se é diagonal, obtemos FA no conjunto de dados combinado e, se é diagonal e isotrópico, obtemos PPCA no conjunto de dados combinado. Portanto, há uma progressão do CCA para o FA e para o PPCA, pois fica cada vez mais restrito. Não vejo que outras opções de possam ser razoáveis.ΨX+YΨΨ

ameba
fonte
Resumindo: o que significa "isotrópico" em sua penúltima sentença?
Gottfried Helms #
@Gottfried, isso significa que ele é diagonal e todos os elementos na diagonal são iguais, isto é . Vou editar para esclarecer. \P=σ2\I
Ameba
Entendo obrigado. Eu havia implementado uma estrutura desse tipo no meu programa pca / fator sem saber seu nome, com base em uma sugestão de S. Mulaik em seu livro de 1972. Bom saber ...
Gottfried Helms