Recentemente, li o livro de Skillicorn sobre decomposições matriciais e fiquei um pouco decepcionado, pois era direcionado a um público de graduação. Gostaria de compilar (para mim e para os outros) uma breve bibliografia de artigos essenciais (pesquisas, mas também artigos inovadores) sobre decomposições matriciais. O que eu tenho em mente principalmente é algo sobre SVD / PCA (e variantes robustas / esparsas) e NNMF, já que essas são de longe as mais usadas. Vocês todos têm alguma recomendação / sugestão? Estou segurando o meu para não influenciar as respostas. Eu pediria para limitar cada resposta a 2-3 papéis.
PS: Refiro-me a essas duas decomposições como as mais usadas na análise de dados . É claro que QR, Cholesky, LU e polar são muito importantes na análise numérica. Esse não é o foco da minha pergunta.
fonte
Para o NNMF, Lee e Seung descrevem um algoritmo iterativo que é muito simples de implementar. Na verdade, eles fornecem dois algoritmos semelhantes, um para minimizar a norma residual de Frobenius e outro para minimizar a divergência de Kullback-Leibler da aproximação e da matriz original.
fonte
Talvez você possa achar interessante
Os dois últimos links mostram como as fatorações matriciais esparsas são usadas na Filtragem Colaborativa. No entanto, acredito que algoritmos de fatoração do tipo SGD podem ser úteis em outro lugar (pelo menos, são extremamente fáceis de codificar)
fonte
Witten, Tibshirani - Decomposição matricial penalizada
http://www.biostat.washington.edu/~dwitten/Papers/pmd.pdf
http://cran.r-project.org/web/packages/PMA/index.html
Martinsson, Rokhlin, Szlam, Tygert - SVD randomizado
http://cims.nyu.edu/~tygert/software.html
http://cims.nyu.edu/~tygert/blanczos.pdf
fonte
No NIPS deste ano, houve um pequeno artigo sobre SVD distribuído em escala muito grande que funciona em uma única passagem em uma matriz de entrada de streaming .
O artigo é mais orientado à implementação, mas coloca as coisas em perspectiva com o tempo real do relógio de parede e tudo. A tabela perto do início também é uma boa pesquisa.
fonte