Como gerar matrizes ortogonais uniformemente aleatórias de determinante positivo?

9

Provavelmente tenho uma pergunta boba sobre a qual, devo confessar, estou confusa. Imagine a geração repetida de matriz ortogonal (ortonormal) aleatória uniformemente distribuída de algum tamanho . Às vezes, a matriz gerada possui o determinante e, às vezes, o determinante . (Existem apenas dois valores possíveis. Do ponto de vista da rotação ortogonal significa que também há uma reflexão adicional além da rotação.)p11det=1

Nós podemos alterar o sinal de det de uma matriz ortogonal de menos para além de, alterando o sinal de qualquer um (ou, mais geralmente, qualquer número ímpar de) coluna do mesmo.

Minha pergunta é: dado que geramos essas matrizes aleatórias repetidamente, introduziremos algum viés em sua natureza aleatória uniforme se toda vez que escolhermos reverter sinal de apenas uma coluna específica (digamos, sempre a primeira ou sempre a última)? Ou devemos ter para escolher a coluna de forma aleatória, a fim de manter as matrizes representam aleatório coleção uniformemente distribuída?

ttnphns
fonte

Respostas:

7

A escolha da coluna não importa: a distribuição resultante nas matrizes ortogonais especiais, SO(n) , ainda é uniforme.

Explicarei isso usando um argumento que se estende, de maneira óbvia, a muitas questões relacionadas sobre a geração uniforme de elementos de grupos. Cada etapa deste argumento é trivial, exigindo nada mais que referência a definições adequadas ou um cálculo simples (como notar que a matrizI1 é ortogonal e auto-inversa).

O argumento é uma generalização de uma situação familiar. Considere a tarefa de elaborar positivos números reais de acordo com uma distribuição contínua especificada . Isso pode ser feito retirando qualquer número real de uma distribuição contínua e negando o resultado, se necessário, para garantir um valor positivo (quase certamente). Para que esse processo tenha a distribuição , deve ter a propriedade queG F GFGFG

G(x)G(x)=F(x).

A maneira mais simples de fazer isso é quando é simétrico em torno de modo que , implicando : todas as probabilidades positivas as densidades são simplesmente duplicadas e todos os resultados negativos são eliminados. A relação familiar entre a distribuição semi-normal ( ) e a distribuição normal ( ) é desse tipo.0 L ( x ) - 1 / 2 = 1 / 2 - L ( - x ) F ( x ) = 2 L ( x ) - 1 F GG0G(x)1/2=1/2G(x)F(x)=2G(x)1FG

A seguir, o grupo desempenha o papel de números reais diferentes de zero (considerado como um grupo multiplicativo ) e seu subgrupo desempenha o papel de números reais positivos . A medida Haar é invariável sob negação; portanto, quando é "dobrada" de para , a distribuição dos valores positivos não muda . (Esta medida, infelizmente, não pode ser normalizada para uma medida de probabilidade - mas é a única maneira pela qual a analogia se decompõe.)S O ( n ) R + d x / x R - { 0 } R +O(n)SO(n)R+dx/xR{0}R+

Negar uma coluna específica de uma matriz ortogonal (quando seu determinante é negativo) é o análogo de negar um número real negativo para dobrá-lo no subgrupo positivo. De maneira mais geral, você pode escolher com antecedência qualquer matriz ortogonal de determinante negativo e usá-la em vez deI 1JI1 : os resultados serão os mesmos.


Embora a questão seja formulada em termos de geração de variáveis ​​aleatórias, ela realmente pergunta sobre distribuições de probabilidade nos grupos de matrizes eS O ( n , R ) = S O ( n )O(n,R)=O(n)SO(n,R)=SO(n) . A conexão entre esses grupos é descrita em termos da matriz ortogonal

I1=(1000010000001)

porque negar a primeira coluna de uma matriz ortogonal significa multiplicar à direita por . Observe que e é a união disjuntaX I 1 S O ( n ) O ( n ) O ( n )XXI1SO(n)O(n)O(n)

O(n)=SO(n)SO(n)I11.

Dado um espaço de probabilidade definido em , o processo descrito na pergunta define um mapaO ( n )(O(n),S,P)O(n)

f:O(n)SO(n)

definindo

f(X)=X

quando eXSO(n)

f(X)=XI1

paraXSO(n)I11 .

A questão está preocupada em gerar elementos aleatórios em obtendo elementos aleatórios : ou seja, "empurrando-os para a frente" via para produzir . O pushforward cria um espaço de probabilidade comω O ( n ) f f ω = f ( ω ) S O ( n ) ( S O ( n ) , S , P )SO(n)ωO(n)ffω=f(ω)SO(n)(SO(n),S,P)

S=fS={f(E)|ES}

e

P(E)=(fP)(E)=P(f1(E))=P(EEI1)

para todos os .ES

Assumir que a multiplicação correta por preserva a medida, e observando que, em qualquer caso, , seguiria imediatamente para todos os , EEI1E SEEI1=ES

P(E)=P(EEI11)=P(E)+P(EI11)=2P(E).

Em particular, quando é invariável sob multiplicação à direita em (que é o que "uniforme" normalmente significa), o fato óbvio de que e seu inverso (que é igual a ) são ortogonais, o que precede, demonstrando que é uniforme. Portanto , é desnecessário selecionar uma coluna aleatória para negação. O ( n ) I 1 I 1 P 'PO(n)I1I1P

whuber
fonte
+1. Este é um artigo muito bom, obrigado por postar esta resposta.
Ameba
11
Uma resposta fantástica. Mas, a partir de The question is concerned about generating, achei difícil me empurrar para frente através do simbolismo. Você poderia resumir o raciocínio em palavras , para um leigo mais cedo, por favor?
ttnphns