Como encontrar variação entre pontos multidimensionais?

12

Suponha que eu tenha uma matriz X que é n por p, ou seja, tem n observações, com cada observação no espaço p-dimensional.

Como encontro a variação dessas n observações?

No caso em que p = 1, só preciso usar a fórmula de variação regular. E os casos em que p> 1.

statnub
fonte

Respostas:

18

Para uma variável aleatória dimensional , temos a seguinte definição da variação:pX=(X1,,Xp)

Var(X)=E[(XEX)(XEX)]=(Var(X1)Cov(X1,Xp)Cov(Xp,X1)Var(Xp))

Ou seja, a variação de um vetor aleatório é definida como a matriz que armazena todas as variações na diagonal principal e as covariâncias entre os diferentes componentes nos outros elementos. A matriz de covariância amostra seria então calculada inserindo os análogos da amostra para as variáveis ​​populacionais:p×p

1n1(i=1n(Xi1X¯1)2i=1n(Xi1X¯1)(XipX¯p)i=1n(XipX¯p)(Xi1X¯1)i=1n(XipX¯p)2)
onde denota a ésima observação do recurso e a média da amostra doXijijX¯jjth característica. Em resumo, a variação de um vetor aleatório é definida como a matriz que contém as variações e covariâncias individuais. Portanto, basta calcular as variações e covariâncias da amostra para todos os componentes do vetor individualmente.
Philipp Burckhardt
fonte