Este post apresenta um método poderoso de raciocínio que evita uma grande quantidade de álgebra e cálculo. Para aqueles familiarizados com esse método, o trabalho é tão automático e natural que a resposta inicial de alguém a uma pergunta como essa é "é óbvio!" Mas talvez não seja tão óbvio até você ver o método. Portanto, todos os detalhes são explicados passo a passo.
fundo
Existem várias fórmulas para a variação dos dados (com média ˉ x = ( x 1 + ⋯ + x n ) / n ), incluindox = x1, x2, … , Xnx¯= ( x1+ ⋯ + xn) / n
Var( x ) = 1n∑i = 1n( xEu- x¯)2= 1n( ∑i = 1nx2Eu) - x¯2.(1)
Isso determina a covariância dos dados emparelhados via( x1, y1) , … , ( Xn, yn)
Cov( x , y ) = 14( Var( x + y ) - Var( x - y ) ) .
A fórmula implícita no posto de covariância com giz de cera mencionado é
C( x , y ) = ∑i = 1n - 1∑j = i + 1n( xj- xEu) ( yj- yEu) = 12∑i , j = 1n( xj- xEu) ( yj- yEu) .2)
Esse post afirma que é proporcional à covariância. A constante de proporcionalidade c ( n ) pode (e faz) variar com n . Assim, quando x = y, uma implicação dessa afirmação é queCc ( n )nx=y
C(x,x)=c(n)Var(x).
Análise
Embora isso possa ser demonstrado com álgebra de força bruta, existe uma maneira melhor: vamos explorar as propriedades fundamentais da covariância. Quais seriam essas propriedades? Eu gostaria de sugerir o seguinte é básico:
Independência de localização. Ou seja, para qualquer número a . (A expressão x - a refere-se ao conjunto de dados x 1 - a , x 2 - a , … , x n - a .)
Cov(x,y)=Cov(x−a,y)
ax−ax1−a,x2−a,…,xn−a
Multilinearidade. Isso implica para qualquer número λ . (A expressão λ x refere-se ao conjunto de dados λ x 1 , λ x 2 , … , λ x n .)
Cov(λx,y)=λCov(x,y)
λλxλx1,λx2,…,λxn
Simetria. A covariância de e y é a covariância de y e x : Cov ( x , y ) = Cov ( y , x ) .xyyx
Cov(x,y)=Cov(y,x).
(xi,yi)
Cov(x,y)=Cov(xσ,yσ)
σ∈Snxσxiσxσ=xσ(1),xσ(2),…,xσ(n).
VarC(1)(2)xi
xi−x¯=(xi−a)−x−a¯¯¯¯¯¯¯¯¯¯¯¯
e
xj−xi=(xj−a)−(xi−a).
(1)(2)
Solução
Ccij=cji
C(x,y)=∑i,j=1ncijxiyj.
cij=ci′j′i,j,i′,j′i≠ji′≠j′cii=ci′i′ii′Cc11c12
0=C(0,0)=location-invarianceC(1,0)=symmetryC(0,1)=location-invarianceC(1,1)
01n
0=C(1,1)=∑i,jncij=nc11+(n2−n)c12,
c11c12
CCov(1)(2)x21c11(1)x211/n−(1/n)2(2)y=xx21n−1(x,x)n−1n−1
c(n)=n−11/n−(1/n)2=n2,
QED . Este foi o único cálculo necessário para demonstrar
Cov(x,y)=1n2C(x,y)=1n2∑i=1n−1∑j=i+1n(xj−xi)(yj−yi).