Transformação linear de uma variável aleatória por uma matriz retangular alta

12

Digamos que temos um vetor aleatório , extraído de uma distribuição com função de densidade de probabilidade . Se o transformarmos linearmente por uma matriz classificação completa para obter , a densidade de será dada porXRnfX(x)n×nAY=AXY

fY(y)=1|detA|fX(A1y).

Agora digamos que transformamos X vez de uma matriz m \ times n B , com m> n , fornecendo \ vec {Z} = B \ vec {X} . Claramente Z \ in \ mathbb {R} ^ m , mas "vive" de um subespaço n- dimensional G \ subset \ mathbb {R} ^ m . Qual é a densidade condicional de \ vec {Z} , dado que sabemos que ela está em G ?m×nBm>nZ=BXZRmnGRmZG

Meu primeiro impulso foi de usar o pseudo-inverso de B . Se B=USVT é a decomposição do valor singular de B , em seguida, B+=VS+UT é a pseudo-inversa, onde S+ é formado por inversão dos não-zero entradas da matriz diagonal S . Imaginei que isso daria

fZ(z)=1|det+S|fX(B+z),
onde det+S quero dizer o produto dos valores singulares diferentes de zero.

Esse raciocínio concorda com a densidade de um normal singular (condicionado ao conhecimento de que a variável vive no subespaço apropriado) fornecido aqui e mencionado também aqui e neste post CrossValidated .

Mas não está certo! A constante de normalização está desativada. Um contra-exemplo (trivial) é dado considerando o seguinte caso: Com XN(0,1) , deixe

Y=(11)X=(XX).
Aqui a matriz B de cima é apenas o vetor ones. Sua pseudo-inversa é
B+=(1/21/2)
e det+B=2 . O raciocínio acima sugere
fY(y)=12π2exp(12yT(B+)TB+y),
mas isso de fato se integra (na linha y=x ) a 12. Sei que, nesse caso, você pode simplesmente soltar uma das entradas de Y , mas quando B é muito maior, identificar o conjunto de entradas a ser descartado é irritante. Por que o raciocínio pseudo-inverso não funciona? Existe uma fórmula geral para a função densidade de uma transformação linear de um conjunto de variáveis ​​aleatórias por uma matriz "alta"? Qualquer referência seria muito apreciada também.
Dan
fonte

Respostas:

2

Para aqueles que podem se deparar com isso no futuro ... a origem do erro realmente decorre da integração. No exemplo acima, a integração ocorre sobre a linha . Portanto, é necessário "parametrizar" a linha e considerar o jacobiano da parametrização ao obter a integral, pois cada passo unitário no eixo corresponde a passos de comprimento na linha. A parametrização que eu estava usando implicitamente foi dada por , em outras palavras, especificando as duas entradas idênticas de por valor. Isso tem jacobiano , que cancela ordenadamente com oy=xx2x(x,x)y22 (provenientes exatamente do mesmo jacobiano) no denominador.

O exemplo foi artificialmente simples - para uma transformação geral , pode-se ter outra parametrização para a saída que é natural no contexto do problema. Como a parametrização precisa abranger o mesmo subespaço que e esse subespaço é um hiperplano, é provável que a parametrização seja linear. Chamando a representação matricial da parametrização , o requisito é simplesmente que ele tenha o mesmo espaço de coluna que (cubra o mesmo hiperplano). Então a densidade final se tornaBGBm×nLB

fZ(z)=|det+L||det+B|fX(B+z).

Em geral, essa configuração é meio estranha, e acho que a coisa certa a fazer é encontrar um conjunto máximo de linhas linearmente independentes de e remover o restante das linhas (junto com os componentes correspondentes da variável transformada ) para obter uma matriz quadrada . Em seguida, o problema reduz-se ao caso classificação completa (supondo que tenha classificação de coluna completa).BzB^n×nB

Dan
fonte