Qual é o mínimo entre todas as distribuições de vetores unitários da variação do produto escalar dos vetores?

10

nx1,,xnkn>kmaxijVar(xiTxj)E[xiTxj]=0

Eu tentei algumas distribuições e quase todas elas têm variação . Por exemplo, a distribuição na qual cada coordenada de cada é escolhida de maneira independente e uniforme de e a distribuição na qual cada é um vetor uniforme independente na esfera unitária dimensional tem variação .1/kxi{1/k,1/k}xik1/k

É a variância mínima entre todas as distribuições?1/k

peng
fonte
Qual é o seu limite de interesse? Ou seja, seria interessante ou não um limite inferior de 1/100k que só funciona para n> 100k?
Daniello 15/10
@ daniello, você quer dizer um limite inferior de 1 / ck para n> ck onde c é alguma constante? Como provar isso?
Pg16
Algo que eu não entendo na pergunta: no começo você diz distribuição sobre vetores unitários , mas nem todas as distribuições que diz tentar gerar vetores unitários ... Você quer dizer isso para todos os , ? E [ | x i | ] = 1xiE[|xi|]=1
Daniello 16/10
@deniello, pretendia fazer com que todos os vetores fossem "unit". Desculpe, esqueci de normalizar o vetor "Gaussian", após a normalização, será o mesmo que o vetor uniforme. Obrigado por apontar esse erro.
peng

Respostas:

8

Apresentarei uma formulação equivalente, mas de aparência mais simples, do problema e mostrarei um limite inferior de ( n / k - 1) / ( n −1). Também mostro uma conexão com um problema aberto em informações quânticas. [Editar na revisão 3: em revisões anteriores, afirmei que uma caracterização exata dos casos em que o limite inferior mostrado abaixo é provavelmente difícil, porque uma pergunta análoga no caso complexo inclui um problema em aberto sobre SIC-POVMs em informação quântica. No entanto, essa conexão com os SIC-POVMs estava incorreta. Para detalhes, consulte a seção “Conexão incorreta aos SIC-POVMs em informações quânticas” abaixo.]

Formulação equivalente

Primeiro, como já foi apontado na resposta de daniello, observe que Var ( x i T x j ) = E [( x i T x j ) 2 ] - E [ x i T x j ] 2 = E [( x i T x j ) 2 ]. Assim, no resto da resposta, nos esquecemos de variância e ao invés minimizar max ij E [( x i t x j ) 2 ].

A seguir, uma vez que decidimos que nosso objetivo é minimizar o máximo de ij E [( x i T x j ) 2 ], podemos ignorar a restrição de que E [ x i T x j ] = 0. Isso ocorre porque, se tivermos vetores unitários x 1 ,…, x n , então podemos negar cada um deles independentemente com probabilidade 1/2 para satisfazer E [ x i T x j ] = 0 sem alterar o valor da função objetivo max ij E [( x i T x j) 2 ].

Além disso, alterando a função de objectivo max ij E [( x i t x j ) 2 ] para (1 / ( n ( n -1))) Σ ij E [( x i t x j ) 2 ] não altera o valor ideal. O último é no máximo o primeiro, porque a média é no máximo o máximo. Entretanto, sempre podemos fazer os valores de E [( x i T x j ) 2 ] para diferentes escolhas de ( i , j ) ( ij ) igual permutando os n vetores x 1 ,…, x n aleatoriamente.

Portanto, para qualquer n e k , o valor ótimo do problema em questão é igual ao mínimo de (1 / ( n ( n −1))) ∑ ij E [( x i T x j ) 2 ] onde x 1 ,…, x n são variáveis ​​aleatórias que recebem vetores unitários em k como valores.

Entretanto, pela linearidade da expectativa, essa função objetivo é igual ao valor esperado E [(1 / ( n ( n −1))) ∑ ij ( x i T x j ) 2 ]. Como o mínimo é no máximo a média, não há mais a necessidade de considerar distribuições de probabilidade. Ou seja, o valor ideal do problema acima é igual ao valor ideal do seguinte:

Escolha vetores unitários x 1 ,…, x n ℝ ℝ k para minimizar (1 / ( n ( n −1))) ∑ ij ( x i T x j ) 2 .

Limite inferior

Usando esta formulação equivalente, provaremos que o valor ótimo é pelo menos ( n / k - 1) / ( n −1).

Para 1in , seja X i = x i x i T o projetor de classificação 1 correspondente ao vetor unitário x i . Então, sustenta que ( x i T x j ) 2 = Tr ( X i X j ).

Vamos Y = Σ i X i . Então, sustenta que Tr ij Tr ( X i X j ) = ∑ i , j Tr ( X i X j ) - n = Tr ( Y 2 ) - n .

A desigualdade de Cauchy-Schwarz implica que Tr ( Y 2 ) ≥ (Tr Y ) 2 / k = n 2 / k e, portanto, ∑ ij Tr ( X i X j ) = Tr ( Y 2 ) - nn 2 / k - n . Dividindo por n ( n −1), obtemos que o valor objetivo é pelo menos ( n / k - 1) / ( n −1).

Em particular, quando n = k +1, a resposta de daniello está dentro de um fator de 2 a partir do valor ideal.

Quando esse limite inferior é atingível?

Atingir este limite inferior ( n / k - 1) / ( N -1) é equivalente a tornar Y = ( n / k ) I . Não sei a caracterização exata quando possível, mas existem condições suficientes:

  • Quando n = k +1, é possível considerar os vetores unitários k +1 que formam um k- simplex regular centrado na origem, melhorando de 2 / ( k ( k +1)) na resposta de daniello para o ideal 1 / k 2 .
  • Quando n é um múltiplo de k , é claramente possível através da fixação de uma base ortonormal de ℝ k e atribuindo a cada um dos vectores de base, para n / k de v 1 , ..., v n .
  • De forma mais geral do que o último ponto de marcador, se for atingível com alguns escolha de k e ambos n = n 1 e n = n 2 , então também é possível para a mesma k e n = n 1 + n 2 . Em particular, é possível, se n = um k + b , onde um e b são inteiros satisfazendo umb ≥0.

Embora eu não tenha verificado os detalhes, parece que qualquer projeto esférico 2 fornece uma solução para atingir esse limite inferior.

Conexão incorreta aos SIC-POVMs em informações quânticas

Nas revisões anteriores, afirmei:

Eu suspeito que responder a isso completamente é uma pergunta difícil. A razão é que, se em vez considerar o complexo espacial vector ℂ k , esta questão está relacionada com um problema em aberto na informação quântica.

Mas essa relação estava incorreta. Eu vou explicar o porquê.

Mais precisamente, considere o seguinte problema:

Escolha vetores unitários x 1 ,…, x n ℂ ℂ k para minimizar (1 / ( n ( n −1))) ∑ ij | x i * x j | 2 .

O limite inferior acima também se aplica a esta versão complexa. Considere o caso em que n = k 2 na versão complexa. Então o limite inferior é igual a 1 / ( k +1).

Até agora, estava correto.

Um conjunto de k 2 vetores unitários x 1 ,…, x k 2 ∈ ℂ k atingindo o limite inferior é chamado de SIC-POVM na dimensão k ,

Esta parte estava incorreta. Um SIC-POVM é um conjunto de k 2 vetores unitários x 1 ,…, x n ℂ ℂ k para os quais | x i * x j | 2 = 1 / ( k 1) para todos os ij . Observe que aqui o requisito deve ser válido para todos os pares ij , não apenas para a média de todos os pares ij . Na seção "Formulação equivalente", mostramos a equivalência entre minimizar o máximo e minimizar a média, mas isso foi possível porque x 1,…, X n eram variáveis ​​aleatórias tomando vetores unitários lá. Aqui x 1 ,…, x n são apenas vetores unitários, portanto não podemos usar o mesmo truque.

Tsuyoshi Ito
fonte
5

A resposta rápida e suja à pergunta é "não, a variação pode ser menor": Seja a base padrão e considere o seguinte processo aleatório: escolha um par de números inteiros distintos i, j de e defina . Para os outros vetores, (para ) atribua-os a maneira individual. Então, para cada , mantenha como está ou gire-o (para ) com probabilidade .v1,v2,,vk{1,2,,k+1}xi=xj=v1xtt{i,j}v2,,vkt{1,,k+1}xixi12

É fácil ver que - e são ortogonais ou apontam na mesma direção / oposta com probabilidade cada.x a x b 1E[xaxb]=0xaxb12

Por outro lado, temos . Temos que se e somente se que acontece com a probabilidade . Caso contrário . Portanto, temos que, para todo , : ( x umx b ) 2 = 1 { um , b } = { i , j }Var[xaxb]=E[(xaxb)2](xaxb)2=1{a,b}={i,j} (xaxb)2=01(k+12)(xaxb)2=0ab

Var[xaxb]=E[(xaxb)2]=1(k+12)

Minha intuição é que isso seja tão ruim (pequeno) quanto possível, mas não tenho uma prova. Mais interessante é que essa construção parece quebrar para n >> k, e também quando os precisam ser escolhidos independentemente (possivelmente de diferentes distribuições).xi

daniello
fonte