Existe uma relação matemática entre:
- o co-seno similaridade de dois vectores e , e
- o co-seno similaridade de e , não-uniformemente dimensionadas através de uma dada matriz de ? Aqui é uma matriz diagonal dada com elementos desiguais na diagonal.
Tentei revisar os cálculos, mas não consegui acessar um link simples / interessante (expressão). Gostaria de saber se existe um.
Por exemplo, os ângulos não são preservados na escala não uniforme, mas qual é a relação entre os ângulos originais e os que se seguem à escala não uniforme? O que pode ser dito sobre o vínculo entre um conjunto de vetores S1 e outro conjunto de vetores S2 - em que S2 é obtido pela escala não uniforme de S1?
linear-algebra
cosine-similarity
turdus-merula
fonte
fonte
Respostas:
Como é bastante geral, e a mudança na semelhança de cosseno depende dos A e B específicos e de sua relação com M , nenhuma fórmula definida é possível. No entanto, existem limites praticamente calculáveis para o quanto a similaridade do cosseno pode mudar . Eles podem ser encontrados extraindo o ângulo entre M A e M B, dado que a semelhança de cosseno entre A e B é um valor especificado, por exemplo, cos ( 2 ϕ ) (onde 2 ϕ é o ângulo entre A e BM A B M MA MB A B cos(2ϕ) 2ϕ A ) A resposta nos diz o quanto qualquer ângulo 2 φ pode eventualmente ser dobrado pela transformação M .B 2ϕ M
Os cálculos ameaçam ser confusos. Algumas escolhas inteligentes de notação, juntamente com algumas simplificações preliminares, reduzem o esforço. Acontece que a solução em duas dimensões revela tudo o que precisamos saber. Este é um problema tratável, dependendo apenas de uma variável real , que é prontamente resolvida usando técnicas de cálculo. Um argumento geométrico simples estende essa solução a qualquer número de dimensões n .θ n
Preliminares matemáticas
Por definição, o cosseno do ângulo entre quaisquer dois vetores e B é obtido normalizando-os em comprimento unitário e obtendo seu produto. Portanto,A B
e, escrevendo , o cosseno do ângulo entre as imagens de A e B sob a transformação M éΣ=M′M A B M
Observe que apenas importa na análise,Σ não o próprio Portanto, podemos explorar a Decomposição de Valor Singular (SVD) de M para simplificar o problema. Lembre-se de que isso expressa M como um produto (da direita para a esquerda) de uma matriz ortogonal V ′ , uma matriz diagonal D e outra matriz ortogonal U :M M M V′ D U
Em outras palavras, existe uma base de vectores privilegiados (as colunas de V ) em que M actua por escalonamento de cada um de e i separadamente pelo i th entrada diagonal de D (que chamaremos d i ) e depois aplicar uma rotação (ou anti-rotação) U ao resultado. Essa rotação final não mudará nenhum comprimento ou ângulo e, portanto, não deve afetar Σ . Você pode ver isso formalmente com o cálculoe1,…,en V M ei Euº D dEu você Σ
Conseqüentemente, para estudar podemos substituir M livremente por qualquer outra matriz que produz os mesmos valores em ( 1 ) . Ordenando o e i de modo que o d i diminuir em tamanho (e assumindo que M não é idêntica zero), uma escolha agradável de M éΣ M ( 1 ) eEu dEu M M
Os elementos diagonais de são( 1 / d1 1) D
Especificamente, o efeito de (seja na sua forma original ou alterada) em todos os ângulos é completamente determinado pelo fato de queM
Análise de um caso especial
Seja . Como alterar os comprimentos dos vetores não altera o ângulo entre eles, podemos assumir que A e B são vetores unitários. No plano, todos esses vetores podem ser designados pelo ângulo que fazem com e 1 , permitindo escrevern = 2 UMA B e1 1
Portanto
(Veja a figura abaixo.)
A aplicação de é simples: ela fixa as primeiras coordenadas de A e B e multiplica suas segundas coordenadas por λ 2 . Portanto, o ângulo de M A a M B éM A B λ2 MA MB
Como é uma função contínua, essa diferença de ângulos é uma função contínua de θ . De fato, é diferenciável. Isso nos permite encontrar ângulos extremos inspecionando os zeros da derivada f ′ ( θ ) . Essa derivada é simples de calcular: é uma razão de funções trigonométricas. Os zeros podem ocorrer apenas entre os zeros de seu numerador, portanto, não vamos nos preocupar em calcular o denominador. Nós obtemosM θ f′(θ)
Os casos especiais de , λ 2 = 1 e ϕ = 0 são facilmente entendidos: eles correspondem às situações em que M é de classificação reduzida (e, assim, esmaga todos os vetores em uma linha); onde M é um múltiplo da matriz de identidade; e onde A e B são paralelos (de onde o ângulo entre eles não pode mudar, independentemente de θ ). O caso λ 2 = - 1 é excluído pela condição λ 2 ≥ 0 .λ2=0 λ2=1 ϕ=0 M M A B θ λ2=−1 λ2≥0
Além desses casos especiais, os zeros ocorrem apenas onde : ou seja, θ = 0 ou θ = π / 2 . Isto significa que a linha de determinados por e 1 bissecta o ângulo A B . Sabemos agora que os valores extremos do ângulo entre M A e M B deve situar-se entre os valores de f ( θ ) , então vamos calcular-los:sin(2θ)=0 θ=0 θ=π/2 e1 AB MA MB f(θ)
Os cossenos correspondentes são
e
Muitas vezes, é suficiente entender como distorce os ângulos retos. Nesse caso, 2 ϕ = π / 2 , levando a tan ( ϕ ) = berço ( ϕ ) = 1 , que você pode conectar nas fórmulas anteriores.M 2ϕ=π/2 tan(ϕ)=cot( ϕ ) = 1
Observe que quanto menor se torna, mais extremos esses ângulos se tornam e maior é a distorção.λ2
Esta figura mostra quatro configurações dos vetores eUMA separados por um ângulo de 2 ϕ = π / 3 . O círculo unitário e sua imagem elíptica sob M são sombreados para referência (com a ação de M redimensionada uniformemente para fazer λ 1 = 1 ). As posições figura indicam o valor de θ , o ponto médio de um e B . O mais próximo que um desses A e B pode chegar quando transformado por M é uma configuração como a da esquerda com θ =B 2ϕ=π/ 3 M M λ1= 1 θ UMA B UMA B M . O mais distante que eles podem estar é uma configuração como a da direita com θ = π / 2 . Duas possibilidades intermediárias são mostradas.θ = 0 θ=π/ 2
Solução para todas as dimensões
Vimos como age expandindo cada dimensão i por um fator λ i . Isso distorcerá a esfera unitária { AM Eu λEu em um elipsóide. O e i determinar seus eixos principais. O λ i são as distâncias a partir da origem, ao longo desses eixos, ao elipsóide. Consequentemente, a menor, λ n , é amenor distância(em qualquer direção) da origem ao elipsóide e a maior, λ 1 , é amaior distância(em qualquer direção) da origem ao elipsóide.{A|A′A = 1 } eEu λEu λn λ1 1
Nas dimensões superiores , A e B fazem parte de um subespaço bidimensional. H mapeia o círculo unitário neste subespaço na intersecção do elipsóide com um plano contendo H A e M B . Essa interseção, sendo uma distorção linear de um círculo, é uma elipse. Obviamente, a maior distância desta elipse não é maior que λ 1 = 1 e a menor distância não é menor que λ n .n > 2 UMA B M MUMA MB λ1 1= 1 λn
Como foi observado no final da secção precedente, o mais possibilidade extrema é quando e B estão situados num plano que contém dois dos e i para os quais a razão entre a correspondente λ i é tão pequena quanto possível. Isso acontecerá no plano e 1 , e n . Já temos a solução para esse caso.UMA B eEu λEu e1 1, en
Conclusões
Os extremos de semelhança de cosseno alcançáveis aplicando a dois vetores com semelhança de cosseno cos ( 2 ϕ ) são dados porM porque( 2 ϕ ) e ( 3 ) . Eles são alcançados situando A e B em ângulos iguais a uma direção na qual Σ = M ′ M alonga ao máximo qualquer vetor (como adireção e 1 ) e os separa em uma direção na qual length alonga minimamente qualquer vetor (como o e n direcção).(2) (3) A B Σ=M′M e1 Σ en
Esses extremos pode ser calculado em termos da SVD de .M
fonte
Você provavelmente está interessado em:
Você pode diagonalizar (ou como você chama, PCA), o que indica que a semelhança deMTM=UΣUT na transformação M se comporta projetando A , B em seus componentes principais e subsequentemente calculando a similaridade neste novo espaço. Para concretizar este um pouco mais, deixe os principais componentes ser u i com valores próprios Ganhe muitos i . EntãoA,B M A,B ui λi
o que lhe dá:
Observe que há uma escala acontecendo aqui: o está se esticando / encolhendo. Quando A , B são vetores unitários e se todo λ i = 1 , M é invertível e a decomposição polar de M satisfaz M = Oλi A,B λi=1 M corresponde a uma rotação, e você começa: , o que equivale a dizer que os produtos internos são invariantes em rotações. Em geral, o ângulo permanece o mesmo quando M é uma transformação conforme, que neste caso exige que Msim(MA,MB)=sim(A,B) M M M com P = um I , isto é, M t H = um 2 I .M=OP P=aI MTM=a2I
fonte