Qual é a conexão entre mínimos quadrados parciais, regressão de classificação reduzida e regressão de componentes principais?

16

A regressão de classificação reduzida e a regressão de componentes principais são apenas casos especiais de mínimos quadrados parciais?

Este tutorial (Página 6, "Comparação de objetivos") afirma que, quando fazemos mínimos quadrados parciais sem projetar X ou Y (ou seja, "não parcial"), ele se torna uma regressão de classificação reduzida ou uma regressão de componente principal, correspondentemente.

Uma declaração semelhante é feita nesta página de documentação do SAS , nas seções "Regressão de classificação reduzida" e "Relações entre métodos".

Uma questão de acompanhamento mais fundamental é se eles têm modelos probabilísticos subjacentes semelhantes.

Minkov
fonte
Este é realmente um problema importante.
Steve
@Steve. Obrigado. Veja meus comentários acima para uma introdução mais detalhada.
Minkov 11/04

Respostas:

15

Esses são três métodos diferentes, e nenhum deles pode ser visto como um caso especial de outro.

Formalmente, se e Y são conjuntos de dados preditores centralizados ( n × p ) e de resposta ( n × q ) e se procurarmos o primeiro par de eixos, wR p para X e vR qXYn×pn×qwRpXvRq para , então esses métodos maximizar as seguintes quantidades:Y

PCA:Var(Xw)RRR:Var(Xw)Corr2(Xw,Yv)Var(Yv)PLS:Var(Xw)Corr2(Xw,Yv)Var(Yv)=Cov2(Xw,Yv)CCA:Var(Xw)Corr2(Xw,Yv)

(Adicionei análise de correlação canônica (CCA)) a esta lista.


Suspeito que a confusão possa ser porque no SAS todos os três métodos parecem ser implementados através da mesma função PROC PLScom parâmetros diferentes. Portanto, pode parecer que todos os três métodos são casos especiais de PLS, porque é assim que a função SAS é nomeada. Este é, no entanto, apenas um nome infeliz. Na realidade, PLS, RRR e PCR são três métodos diferentes que acabam de ser implementados no SAS em uma função que por algum motivo é chamada PLS.

Os dois tutoriais aos quais você se vinculou são muito claros sobre isso. A página 6 do tutorial de apresentação indica os objetivos dos três métodos e não diz que o PLS "se torna" RRR ou PCR, ao contrário do que você reivindicou na sua pergunta. Da mesma forma, a documentação do SAS explica que três métodos são diferentes, fornecendo fórmulas e intuição:

[A] regressão dos componentes principais seleciona fatores que explicam o máximo possível de variação preditiva, a regressão de classificação reduzida seleciona fatores que explicam o máximo possível de variação de resposta e os mínimos quadrados parciais equilibram os dois objetivos, buscando fatores que explicam a variação da resposta e do preditor .

Existe até uma figura na documentação do SAS mostrando um bom exemplo de brinquedo em que três métodos fornecem soluções diferentes. Neste exemplo de brinquedo, existem dois preditores e x 2 e uma variável de resposta y . A direção em X mais correlacionada com y é ortogonal à direção da variação máxima em Xx1x2yXyX . Portanto, PC1 é ortogonal ao primeiro eixo RRR e o eixo PLS está em algum lugar no meio.

PCR, PLS, RRR

Pode-se adicionar uma penalidade de crista à função perdida de RRR, obtendo regressão de classificação reduzida de crista, ou RRRR. Isso puxará o eixo de regressão na direção PC1, um pouco semelhante ao que o PLS está fazendo. No entanto, a função de custo para RRRR não pode ser gravada em um formulário PLS, portanto, elas permanecem diferentes.

Observe que, quando há apenas uma variável preditora , CCA = RRR = regressão usual.y

ameba diz Restabelecer Monica
fonte
4
A mesa no final é muito útil. Com base nessa tabela, pode-se considerar PCA, RRR e CCA como "casos especiais" de PLS se você também acha que bicicletas e monociclos são casos especiais de um triciclo. Eu não costumo pensar assim.
EdM
2
@ Edm, acho que se pode dizer que todos esses métodos são casos especiais de algum método unificador que realmente não tem nome (mas pode-se inventar!). Mas o nome "PLS" já tem um significado estabelecido e esse significado não inclui nenhuma dessas outras técnicas.
Ameba diz Reinstate Monica
11
E obrigada! Eu decidi agora para mover a tabela para o início da resposta :)
ameba diz Reintegrar Monica
2
XYVar(Xw)αCorr(Xw,Yv)βVar(Yv)γ e obter diversos métodos para vário valores de alfa, beta e gama. Não pense que é muito útil.
Ameba diz Reinstate Monica
11
@Moskowitz: Em geral, quando as pessoas falam sobre o método A como um "caso especial" do método B, elas significam que B é mais geral e A é equivalente a B com alguns parâmetros específicos. Eles não significam que A dê os mesmos resultados que B sob algumas condições especiais no conjunto de dados. Daí a minha resposta à sua pergunta.
Ameba diz Reinstate Monica