Como afirmado nesta pergunta, a classificação máxima da matriz de covariância é onde é o tamanho da amostra e, portanto, se a dimensão da matriz de covariância for igual ao tamanho da amostra, seria singular. Não consigo entender por que subtraímos da classificação máxima da matriz de covariância.
covariance-matrix
linear-algebra
user3070752
fonte
fonte
Respostas:
O estimador imparcial da matriz de covariância da amostra, dadon pontos de dados xi∈Rd é
Por que tem posto n - 1 e não posto n , como parece, porque estamos a soma n rank 1 matrizes?∑ziz⊤i n−1 n n 1
A resposta é que isso acontece porque não são independentes. Por construção, Σ z i = 0 . Portanto, se você conhece n - 1 de z i , o último z n restante é completamente determinado; não estamos somando n rank independentes 1 matrizes, estamos somando única n - 1 rank independentes 1 matrizes e, em seguida, adicionando mais um rank 1zi ∑zi=0 n−1 zi zn n 1 n−1 1 1 matriz que está completamente linearmente determinado pelo resto. Esta última adição não altera a classificação geral.
Podemos ver esta directamente se reescrever como z n = - n - 1 Σ i = 1 z i , e agora ligá-lo na expressão acima: n Σ i = 1 z i z ⊤ i = n - 1 ∑ i = 1 z i z ⊤ i + ( - n - 1 ∑ i = 1∑zi=0
Este resultado, a propósito, sugere por que o fator no estimador imparcial de covariância é1n−1 1n .
fonte
Um pouco mais curto, acredito, a explicação é assim:
fonte