Acho que a resposta deve ser sim, mas ainda sinto que algo não está certo. Deve haver alguns resultados gerais na literatura, alguém poderia me ajudar?
covariance
matrix
covariance-matrix
linear-algebra
Jingjings
fonte
fonte
Respostas:
Não.
Considere três variáveis , e . Sua matriz de covariância, , não é definida positivamente, pois existe um vetor ( ) para o qual não é positivo.Y Z = X + Y M z = ( 1 , 1 , - 1 ) ′ z ′ M zX Y Z=X+Y M z =(1,1,−1)′ z′Mz
Matrizes de covariância populacional são semi-definidas positivas.
(Veja a propriedade 2 aqui .)
O mesmo deve ser aplicado às matrizes de covariância de amostras completas (sem valores ausentes), pois elas também podem ser vistas como uma forma de covariância discreta na população.
No entanto, devido à inexatidão de cálculos numéricos de ponto flutuante, mesmo casos definidos algebricamente positivos podem ocasionalmente ser computados para não serem nem mesmo semi-definidos positivos; boa escolha de algoritmos pode ajudar com isso.
De maneira mais geral, as matrizes de covariância da amostra - dependendo de como elas lidam com os valores ausentes em algumas variáveis - podem ou não ser semi-definidas positivas, mesmo na teoria. Se a exclusão em pares for usada, por exemplo, não haverá garantia de semi-definição positiva. Além disso, o erro numérico acumulado pode fazer com que as matrizes de covariância da amostra que deveriam ser nocionalmente positivas semi-definidas falhem.
Igual a:
Isso aconteceu no primeiro exemplo que eu tentei (eu provavelmente deveria fornecer uma semente, mas não é tão raro que você precise experimentar vários exemplos antes de obter uma).
O resultado saiu negativo , embora deva ser algebricamente zero. Um conjunto diferente de números pode gerar um número positivo ou um zero "exato".
-
Exemplo de falta moderada que leva à perda de semidefinitividade positiva por meio de exclusão por pares:
fonte
Bem, para entender por que a matriz de covariância de uma população é sempre semi-definida positiva, observe que: onde são alguns números reais e são algumas variáveis aleatórias com valor real.
Isso também explica por que, no exemplo dado por Glen_b, a matriz de covariância não era positiva definida. Tínhamos e , então e o a variação de uma variável aleatória constante é .X 1 = X , X 2 = Y , X 3 = Z = X + Y ∑ 3 i = 1 y i X i = 0 0y1=1,y2=1,y3=−1 X1=X,X2=Y,X3=Z=X+Y ∑3i=1yiXi=0 0
fonte