Eu sei de estudos anteriores que
No entanto, não entendo por que isso acontece. Percebo que o efeito será "aumentar" a variação quando A e B covarem altamente. Faz sentido que, ao criar um composto a partir de duas variáveis altamente correlacionadas, você tenderá a adicionar as observações altas de A com as altas observações de B e as baixas observações de A com as baixas observações de B. Isso tenderá a crie valores extremos altos e baixos na variável composta, aumentando a variação do composto.
Mas por que funciona multiplicar a covariância por exatamente 2?
variance
covariance
intuition
user1205901 - Restabelecer Monica
fonte
fonte
Respostas:
Resposta simples:
A variação envolve um quadrado:
Portanto, sua pergunta se resume ao fator 2 na identidade do quadrado:
O que pode ser entendido visualmente como uma decomposição da área de um quadrado do lado na área dos quadrados menores dos lados e , além de dois retângulos dos lados e :(a+b) a b a b
Resposta mais envolvida:
Se você deseja uma resposta matematicamente mais envolvida, a covariância é uma forma bilinear, o que significa que é linear tanto no primeiro quanto no segundo argumento, isso leva a:
Na última linha, usei o fato de que a covariância é simétrica:
Resumindo:
São dois porque você deve considerar tanto quanto .cov(A,B) cov(B,A)
fonte
O conjunto de variáveis aleatórias é um espaço vetorial, e muitas das propriedades do espaço euclidiano podem ser analogas a elas. O desvio padrão atua como um comprimento e a variação como comprimento ao quadrado. A independência corresponde a ser ortogonal, enquanto a correlação perfeita corresponde à multiplicação escalar. Assim, a variância das variáveis independentes segue o Teorema de Pitágoras: .
var(A+B)=var(A)+var(B)
Se eles estão perfeitamente correlacionados, então
std(A+B)=std(A)+std(B)
Observe que isso é equivalente a
var(A+B)=var(A)+var(B)+2var(A)var(B)−−−−−−−−−−−√
Se eles não são independentes, seguem uma lei análoga à lei dos cossenos:
var(A+B)=var(A)+var(B)+2cov(A,B)
Observe que o caso geral é um entre independência completa e correlação perfeita. Se e são independentes, então é zero. Assim, o caso geral é que tem sempre uma prazo e um prazo, e então ele tem alguma variação no prazo ; quanto mais correlacionadas as variáveis, maior será o terceiro termo. E isso é precisamente o que é: é vezes o de e .A B cov(A,B) var(A,B) var(A) var(B) 2var(A)var(B)−−−−−−−−−−−√ 2cov(A,B) 2var(A)var(B)−−−−−−−−−−−√ r2 A B
onde eMeasureOfCorrelation=r2 PerfectCorrelationTerm=2var(A)var(B)−−−−−−−−−−−√
Coloque em outros termos, se , entãor=correl(A,B)
Assim, é análogo ao na Lei dos Cossenos.r2 cos
fonte
Eu acrescentaria que o que você citou não é a definição de , mas uma conseqüência das definições de e . Portanto, a resposta para o porquê dessa equação é o cálculo realizado pela byouness . Sua pergunta pode realmente ser por que isso faz sentido; informalmente:Var(A+B) Var Cov
Quanto "variará" depende de quatro fatores:A+B
O que nos leva a porque é um operador simétrico.
fonte