Eu conheci a seguinte técnica de rastreamento aleatório em M. Seeger, "Atualizações de baixa classificação para a decomposição de Cholesky", Universidade da Califórnia em Berkeley, Tech. Rep. 2007.
onde .
Como uma pessoa sem profundos conhecimentos de matemática, me pergunto como essa igualdade pode ser alcançada. Além disso, como podemos interpretar , por exemplo, geometricamente? Onde devo procurar para entender o significado de obter o produto interno de um vetor e seu valor de intervalo? Por que a média é igual à soma dos valores próprios? Além da propriedade teórica, qual é a sua importância prática?
Eu escrevi um trecho de código MATLAB para ver se funciona
#% tr(A) == E[x'Ax], x ~ N(0,I)
N = 100000;
n = 3;
x = randn([n N]); % samples
A = magic(n); % any n by n matrix A
y = zeros(1, N);
for i = 1:N
y(i) = x(:,i)' * A * x(:,i);
end
mean(y)
trace(A)
O traço é 15, onde a aproximação é 14,9696.
fonte
Se é simétrico positivo definido, então com ortonormal e diagonal com autovalores na diagonal. Como possui matriz de covariância de identidade e é ortonormal, também possui matriz de covariância de identidade. Portanto, escrevendo , temos . Como o operador de expectativa é linear, isso é apenas . Cada é qui-quadrado com 1 grau de liberdade, portanto, possui o valor esperado 1. Portanto, a expectativa é a soma dos valores próprios.A A=UtDU U D x U Ux y=Ux E[xTAx]=E[ytDy] ∑ni=0λiE[y2i] yi
Geometricamente, matrizes definidas positivas simétricas estão em 1-1 correspondência com elipsóides - dada pela equação . Os comprimentos dos eixos do elipsóide são dados por onde são os autovalores.A xTAx=1 1/λ−−√i λi
Quando onde é a matriz de covariância, este é o quadrado da distância de Mahalanobis .A=C−1 C
fonte
Deixe-me abordar a parte "qual é a sua importância prática" da questão. Há muitas situações em que temos a capacidade de produtos vetor matriz de computação de forma eficiente, mesmo se não temos uma cópia armazenada da matriz ou não tem armazenamento suficiente para guardar uma cópia de . Por exemplo, pode ser do tamanho 100.000 por 100.000 e totalmente denso - seria necessário 80 gigabytes de RAM para armazenar essa matriz no formato de ponto flutuante de dupla precisão.Ax A A A
Algoritmos aleatórios como este pode ser utilizado para estimar o rastreio de ou (usando um algoritmo relacionada) diagonais individuais de .A A
Algumas aplicações desta técnica para problemas de inversão geofísica em larga escala são discutidas em
JK MacCarthy, B. Borchers e RC Aster. Estimativa estocástica eficiente da matriz de resolução do modelo na diagonal e validação cruzada generalizada para grandes problemas inversos geofísicos. Journal of Geophysical Research, 116, B10304, 2011. Link para o artigo
fonte