As implementações atuais do algoritmo de projeção aleatória reduzem a dimensionalidade das amostras de dados, mapeando-as de para usando uma matriz de projeção cujas entradas são iid de uma distribuição adequada (por exemplo, de ):
Convenientemente, existem provas teóricas mostrando que esse mapeamento preserva aproximadamente distâncias aos pares.
No entanto, recentemente encontrei essas notas em que o autor afirma que esse mapeamento com uma matriz aleatória não é uma projeção no sentido algébrico linear estrito da palavra (página 6). Pelas explicações dadas, isso ocorre porque as colunas de não são estritamente ortogonais quando suas entradas são escolhidas independentemente de . Portanto, versões anteriores do RP, nas quais a ortogonalidade das colunas de foi aplicada, podem ser consideradas como uma projeção.
Você pode fornecer uma explicação mais detalhada de (1) qual é a definição de uma projeção nesse sentido estrito e (2) por que RP não é uma projeção sob essa definição ?.
Respostas:
Qual é a definição de uma projeção nesse sentido estrito (algébrico linear) (da palavra)
Para projeção ortogonal ou vetorial, você tem esse
Por que RP não é uma projeção sob essa definição?
Michael Mahoney escreve em suas notas de aula que depende de como o PR é construído , se o PR é ou não uma projeção no sentido algébrico linear tradicional. Isso ele faz nos terceiro e quarto pontos:
Portanto, você poderia fazer, principalmente, a projeção aleatória com uma construção diferente, limitada a matrizes ortogonais (embora não seja necessária). Veja, por exemplo, o trabalho original:
A entrada da Wikipedia descreve a projeção aleatória dessa maneira (o mesmo é mencionado nas notas de aula nas páginas 10 e 11)
Mas você geralmente não obtém essa ortogonalidade quando pega todas as entradas da matriz nas variáveis aleatórias e independentes da matriz com uma distribuição normal (como Whuber mencionou em seu comentário com uma conseqüência muito simples "se as colunas fossem sempre ortogonais, suas entradas poderiam não seja independente ").
A matriz deR e o produto, no caso de colunas ortonormais, pode ser vista como uma projecção, pois refere-se a uma matriz de projecção P= RTR . Isso é um pouco o mesmo que ver a regressão dos mínimos quadrados comuns como uma projeção. O produto b = RTx não é a projeção, mas fornece uma coordenada em um vetor base diferente. A projecção 'real' é x′= R b = RTR x , e a matriz de projecção é RTR .
A matriz de projecçãoP= RTR necessita de ser o operador identidade no subespaço você que é a gama da projecção (ver as propriedades mencionadas na página Wikipedia). Ou, diferentemente, ele precisa ter os autovalores 1 e 0, de modo que o subespaço para o qual é a matriz de identidade seja o intervalo dos vetores próprios associados aos autovalores 1. Com entradas de matriz aleatórias, você não obterá essa propriedade. Este é o segundo ponto nas notas da aula
Portanto, a projeção aleatória por diferentes construções, como o uso de entradas aleatórias na matriz, não é exatamente igual a uma projeção ortogonal. Mas é computacionalmente mais simples e, de acordo com Michael Mahoney, é "bom o suficiente".
fonte
Isso mesmo: "projeção aleatória" não é estritamente uma projeção.
Projecção está claramente um objecto matemático definido: https://en.wikipedia.org/wiki/Projection_(linear_algebra) - é um operador idempotentent linear, ou seja, linear operadorP tal que P2= P . Aplicar uma projeção duas vezes é o mesmo que aplicá-la apenas uma vez, porque depois que um ponto é projetado em um subespaço, ele deve permanecer lá se for projetado novamente. Não há nada sobre ortogonalidade nesta definição; de fato, uma projeção pode ser oblíqua (veja Wikipedia).
Observe que apenas matrizes quadradas podem representar "projeções" nesse sentido. "Projeção aleatória" usa uma matrizd× k aleatória R com k « d , portanto, não pode ser uma projeção no sentido da definição acima.
Mesmo se você tornar as colunas deR ortonormais (por exemplo, aplicando o processo de Gram-Schmidt), esse argumento ainda será aplicado. Alguém recentemente fez esta pergunta sobre PCA: O que exatamente deveria ser chamado de "matriz de projeção" no contexto do PCA? - uma matriz d× k você de autovetores ortonormais não é estritamente uma projeção.
fonte
Ficaria muito grato se você pudesse confirmar / corrigir meu raciocínio aqui.
Referência:
[1] http://www.dankalman.net/AUhome/classes/classesS17/linalg/projections.pdf
fonte
Se você usar inversão ou permutação de sinal aleatório recomputável antes da transformação Fast Walsh Hadamard, a projeção aleatória é ortogonal.
fonte