Entendendo que

8

Acabei de ver esta pergunta e a maravilhosa resposta aceita neste fórum. Fui então desencadeado para tentar entender intuitivamente por que a divisão de SxSy está normalizando a covariância:

COV(X,Y)SxSy[1,1]

Eu acho que será útil Se eu apenas entender por que SxSx normaliza o COV(X,X) como 1 . Claro que entendo que, por definição, são iguais. Mas minha pergunta é basicamente a seguinte: usando a terminologia da resposta aceita, por que a soma total de vermelho no gráfico é exatamente SxSx=VAR(X) (mais preciso, tanto quanto eu entendo, é dizer a soma de os retângulos divididos por n2 devem ser VAR(X) ). Quero dizer, se tirarmos amostra de10 observações, do que temos45 retângulos, enquanto usamos a definição, temos que encontrar a média de apenas10 valores.

d_e
fonte

Respostas:

8

Este post apresenta um método poderoso de raciocínio que evita uma grande quantidade de álgebra e cálculo. Para aqueles familiarizados com esse método, o trabalho é tão automático e natural que a resposta inicial de alguém a uma pergunta como essa é "é óbvio!" Mas talvez não seja tão óbvio até você ver o método. Portanto, todos os detalhes são explicados passo a passo.

fundo

Existem várias fórmulas para a variação dos dados (com média ˉ x = ( x 1 + + x n ) / n ), incluindox=x1,x2,,xnx¯=(x1++xn)/n

(1)Var(x)=1ni=1n(xix¯)2=1n(i=1nxi2)x¯2.

Isso determina a covariância dos dados emparelhados via(x1,y1),,(xn,yn)

Cov(x,y)=14(Var(x+y)Var(xy)).

A fórmula implícita no posto de covariância com giz de cera mencionado é

(2)C(x,y)=i=1n1j=i+1n(xjxi)(yjyi)=12i,j=1n(xjxi)(yjyi).

Esse post afirma que é proporcional à covariância. A constante de proporcionalidade c ( n ) pode (e faz) variar com n . Assim, quando x = y, uma implicação dessa afirmação é queCc(n)nx=y

C(x,x)=c(n)Var(x).

Análise

Embora isso possa ser demonstrado com álgebra de força bruta, existe uma maneira melhor: vamos explorar as propriedades fundamentais da covariância. Quais seriam essas propriedades? Eu gostaria de sugerir o seguinte é básico:

  1. Independência de localização. Ou seja, para qualquer número a . (A expressão x - a refere-se ao conjunto de dados x 1 - a , x 2 - a , , x n - a .)

    Cov(x,y)=Cov(xa,y)
    axax1a,x2a,,xna
  2. Multilinearidade. Isso implica para qualquer número λ . (A expressão λ x refere-se ao conjunto de dados λ x 1 , λ x 2 , , λ x n .)

    Cov(λx,y)=λCov(x,y)
    λλxλx1,λx2,,λxn
  3. Simetria. A covariância de e y é a covariância de y e x : Cov ( x , y ) = Cov ( y , x ) .xyyx

    Cov(x,y)=Cov(y,x).
  4. (xi,yi)

    Cov(x,y)=Cov(xσ,yσ)
    σSnxσxiσxσ=xσ(1),xσ(2),,xσ(n).

VarC(1)(2)xi

xix¯=(xia)xa¯

e

xjxi=(xja)(xia).

(1)(2)


Solução

Ccij=cji

C(x,y)=i,j=1ncijxiyj.

cij=ciji,j,i,jijijcii=ciiiiCc11c12

0=C(0,0)=location-invarianceC(1,0)=symmetryC(0,1)=location-invarianceC(1,1)

01n

0=C(1,1)=i,jncij=nc11+(n2n)c12,
c11c12

CCov(1)(2)x12c11(1)x121/n(1/n)2(2)y=xx12n1(x,x)n1n1

c(n)=n11/n(1/n)2=n2,

QED . Este foi o único cálculo necessário para demonstrar

Cov(x,y)=1n2C(x,y)=1n2i=1n1j=i+1n(xjxi)(yjyi).
whuber
fonte