Esta questão resulta da discussão que se segue a uma pergunta anterior: Qual é a conexão entre mínimos quadrados parciais, regressão de classificação reduzida e regressão de componentes principais?
Para a análise de componentes principais, um modelo probabilístico comumente usado é
Conforme apontado na resposta à pergunta anterior de @amoeba, a regressão de classificação reduzida, os mínimos quadrados parciais e a análise de correlação canônica têm formulações estreitamente relacionadas,
A questão é: quais são os modelos probabilísticos por trás do RRR, PLS e CCA? Em particular, estou pensando emComo depende de e em RRR, PLS e CCA? Além disso, existe um modelo probabilístico unificado (como o modelo de covariância cravada para PCA) para eles?
fonte
Respostas:
A análise de correlação canônica probabilística (CCA probabilística, PCCA) foi introduzida em Bach & Jordan, 2005, Uma interpretação probabilística da análise de correlação canônica , vários anos após Tipping & Bishop apresentarem sua análise probabilística de componentes principais (PCA probabilística, PPCA).
Resumidamente, é baseado no seguinte modelo probabilístico:
Aqui covariâncias de ruído e são matrizes simétricas arbitrárias de classificação completa.Ψx Ψy
Se considerarmos a variável latente unidimensional , suponha que todas as médias sejam zero e combine e em um vetor, obtemos:z μx=μy=0 x y
Bach & Jordan provaram que isso é equivalente ao CCA padrão. Especificamente, a solução de máxima verossimilhança (ML) é dada por onde são matrizes de covariância de amostra de ambos os conjuntos de dados, é o primeiro par de eixos canônicos e são arbitrários números (ambos entre e ), dando a primeira correlação canônica como um produto.
Como você vê, não são diretamente iguais aos eixos do CCA, mas são dados por alguma transformação desses. Veja Bach & Jordan para mais detalhes.wi
Não tenho uma boa compreensão intuitiva do PCCA. Como você pode ver, a matriz de covariância cruzada entre e é modelada por , portanto, pode-se esperar ingenuamente que produza eixos PLS. A solução ML está, no entanto, relacionada aos eixos CCA. Provavelmente, isso se deve à estrutura diagonal do bloco de .X Y wxw⊤y wi Ψ=(Ψx00Ψy)
Não conheço nenhuma versão probabilística semelhante de RRR ou PLS e não consegui me apresentar a nenhuma delas. Observe que se é diagonal, obtemos FA no conjunto de dados combinado e, se é diagonal e isotrópico, obtemos PPCA no conjunto de dados combinado. Portanto, há uma progressão do CCA para o FA e para o PPCA, pois fica cada vez mais restrito. Não vejo que outras opções de possam ser razoáveis.Ψ X+Y Ψ Ψ
fonte