A análise de correlação canônica (CCA) visa maximizar a correlação usual de produto-momento de Pearson (ou seja, coeficiente de correlação linear) das combinações lineares dos dois conjuntos de dados.
Agora, considere o fato de que esse coeficiente de correlação mede apenas associações lineares - esse é o motivo pelo qual também usamos, por exemplo, os coeficientes de correlação Spearman- ou Kendall- (rank) que medem monótonos arbitrários (não necessariamente lineares) conexão entre variáveis.
Portanto, eu estava pensando no seguinte: uma limitação do CCA é que ele apenas tenta capturar a associação linear entre as combinações lineares formadas devido à sua função objetivo. Não seria possível estender o CCA em algum sentido, maximizando, digamos, Spearman- vez de Pearson- ?
Esse procedimento levaria a algo estatisticamente interpretável e significativo? (Faz sentido - por exemplo - executar o CCA em fileiras ...?) Gostaria de saber se ajudaria quando estamos lidando com dados não normais ...
fonte
Respostas:
Usei expansões de splines cúbicas restritas ao calcular variáveis canônicas. Você está adicionando funções básicas não lineares à análise exatamente como adicionaria novos recursos. Isso resulta em análise não linear de componentes principais. Veja a R
Hmisc
pacote detranscan
função para um exemplo. Ohomals
pacote R leva isso muito mais longe.fonte
O método padrão do CCA trabalha com a matriz do coeficiente de correlação do momento do produto. Para o maior mgnitude CC, ele constrói duas variáveis compostas z1 (n) e z2 (n) por combinação linear de duas matixes (com n linhas e variáveis m1 e m2), de modo que o abs (correlação (z1, z2)) seja maximizado. Essa função objetivo pode ser maximizada diretamente, mesmo que a correlação (z1, z2) não seja o momento do produto, mas seja definida de forma diferente.
Mishra, SK (2009) "Uma nota sobre a análise de correlação canônica ordinal de dois conjuntos de classificações"
http://papers.ssrn.com/sol3/papers.cfm?abstract_id=1328319
fonte