Incorrelação + Normalidade das Articulações = Independência. Por quê? Intuição e mecânica

7

Duas variáveis ​​não correlacionadas não são necessariamente independentes, como é simplesmente exemplificado pelo fato de e não serem correlacionados, mas não independentes. No entanto, duas variáveis ​​não correlacionadas e distribuídas em conjunto normalmente são garantidas como independentes. Alguém pode explicar intuitivamente por que isso é verdade? O que exatamente a normalidade conjunta de duas variáveis ​​adiciona ao conhecimento da correlação zero entre duas variáveis, o que nos leva a concluir que essas duas variáveis ​​DEVEM ser independentes?XX2

ColorStatistics
fonte
3
Geralmente não é o caso de e não serem correlacionados (a menos que você coloque condições específicas no que os tornariam não correlacionadas, mas você não menciona nenhuma). XX2X
Glen_b -Reinstala Monica 10/11
Primeiro, voltando ao fato de que correlação se refere a relações lineares, explique como X ^ 2 está linearmente relacionado a X. Segundo, você parece estar afirmando que não apenas X ^ 2 e X podem ser linearmente relacionados, mas que eles são linearmente relacionados mais frequentemente do que não, dado o uso da palavra "geralmente". Por favor explique. Obrigado.
ColorStatistics
11
@Glen_b está no local: X e X2 não são correlacionados se você estipular especificamente o intervalo de X. Por exemplo, Pearson'sr0.98 para X e X2 ao restringir a amostra de XN(0,1) para valores de Xna faixa maior que 1. Confira você mesmo (R):X <- rnorm(n=10000); X2 <- X*X; cor(X[X>1],X2[X>1])
Alexis
11
@ Alexis Não é apenas a faixa, mas a maneira como as probabilidades se distribuem sobre esses valores dentro da faixa. Se você altera a distribuição, altera a correlação.
Glen_b -Reinstala Monica 10/11
3
A correlação @ColorStatistics é o grau de relacionamento linear, sim. No entanto, a projeção dex2 para xpode envolver um componente linear substancial. Se você quiser ver um exemplo com alta correlação linear entre uma variável e seu quadrado, deixeXtome os valores 0 e 1 com igual probabilidade (por exemplo, registre o número de caras no lançamento de uma única moeda justa). Então corr(X,X2)=1(!) Se você estiver livre para especificar a distribuição deX, você pode fazer a correlação entre X e X2 pegue qualquer valor entre 1 e 1. ...
ctd

Respostas:

6

A função densidade de probabilidade conjunta (pdf) da distribuição normal bivariada é:

f(x1,x2)=12πσ1σ21ρ2exp[z2(1ρ2)],

Onde

z=(x1μ1)2σ122ρ(x1μ1)(x2μ2)σ1σ2+(x2μ2)2σ22.
Quando ρ=0,
f(x1,x2)=12πσ1σ2exp[12{(x1μ1)2σ12+(x2μ2)2σ22}]=12πσ1exp[12{(x1μ1)2σ12}]12πσ2exp[12{(x2μ2)2σ22}]=f(x1)f(x2)
.

Então eles são independentes.

user158565
fonte
Eu era duas linhas mais devagar que você! (+1)
jbowman 9/11/19
11
Obrigado a todos. Prova elegante. Está claro agora. Parece-me que, dado o fluxo da prova, eu deveria ter perguntado o que o conhecimento da correlação zero acrescenta ao conhecimento da normalidade das articulações e não o contrário.
ColorStatistics
11
Que tal uma explicação intuitiva sobre por que é verdade?
ColorStatistics
Talvez não exista uma explicação simples e intuitiva.
user158565
Poderíamos ter alguma intuição ao longo da linha de raciocínio de que os momentos superiores a (2) de um processo gaussiano são todos zero e, adicionando a condição de correlação zero (momento 2), todos os momentos são maiores que um para zero?
ColorStatistics
2

Normalidade articular de duas variáveis ​​aleatórias X,Y pode ser caracterizado de duas maneiras simples:

  • Para cada par a,b de números reais (não aleatórios), aX+bY tem uma distribuição normal univariada.

  • Existem variáveis ​​aleatórias Z1,Z2i.i.d.N(0,1) e números reais a,b,c,d de tal modo que

    X=aZ1+bZ2and Y=cZ1+dZ2.

É fácil mostrar que o primeiro deles segue do segundo. Que o segundo se segue do primeiro exige mais trabalho, e talvez eu o publique em breve. . .

Se o segundo for verdade, então cov(X,Y)=ac+bd.

Se essa covariância for 0, então os vetores (a,b), (c,d)são ortogonais entre si. EntãoX é um múltiplo escalar da projeção ortogonal de (Z1,Z2) para (a,b) e Y para (c,d).

Agora, junte o fato da ortogonalidade à simetria circular da densidade articular de (Z1,Z2), ver que a distribuição de (X,Y) deve ser igual à distribuição de duas variáveis ​​aleatórias, uma das quais é um múltiplo escalar da projeção ortogonal de (Z1,Z2) no xeixo, ou seja, é um múltiplo escalar de Z1, e o outro é similarmente um múltiplo escalar de Z2.

Michael Hardy
fonte