Alguém me fez essa pergunta em uma entrevista de emprego e eu respondi que sua distribuição conjunta é sempre gaussiana. Pensei que sempre posso escrever um gaussiano bivariado com seus meios, variância e covariâncias. Gostaria de saber se pode haver um caso em que a probabilidade conjunta de dois gaussianos não seja gaussiana?
91
Respostas:
A distribuição normal bivariada é a exceção , não a regra!
É importante reconhecer que "quase todas" distribuições conjuntas com marginais normais não são a distribuição normal bivariada. Ou seja, o ponto de vista comum de que distribuições conjuntas com marginais normais que não são o normal bivariado são de alguma forma "patológicas", é um pouco equivocado.
Certamente, o normal multivariado é extremamente importante devido à sua estabilidade sob transformações lineares e, portanto, recebe grande parte da atenção nas aplicações.
Exemplos
É útil começar com alguns exemplos. A figura abaixo contém mapas de calor de seis distribuições bivariadas, todas com marginais normais padrão. Os esquerdos e médios na linha superior são normais bivariados, os demais não são (como deve ser aparente). Eles são descritos mais abaixo.
Os ossos nus das cópulas
As propriedades da dependência são frequentemente analisadas eficientemente usando cópulas . Uma cópula bivariada é apenas um nome sofisticado para uma distribuição de probabilidade no quadrado da unidade com marginais uniformes .[0,1]2
Suponha que seja uma cópula bivariada. Então, imediatamente acima, sabemos que , e , por exemplo.C ( u , v ) ≥ 0 C ( u , 1 ) = u C ( 1 , v ) = vC(u,v) C(u,v)≥0 C(u,1)=u C(1,v)=v
Podemos construir variáveis aleatórias bivariadas no plano euclidiano com marginais pré - especificados por uma simples transformação de uma cópula bivariada. Permita que e sejam distribuições marginais prescritas para um par de variáveis aleatórias . Então, se é uma cópula bivariada, é uma função de distribuição bivariada com os marginais e . Para ver esse último fato, observe que O mesmo argumento funciona para .F 2 ( X , Y ) C ( u , v ) F ( x , y ) = C ( F 1 ( x ) , F 2 ( y ) ) F 1 F 2F1 F2 (X,Y) C(u,v)
Para e contínuos , o teorema de Sklar afirma uma inversa, implicando singularidade. Ou seja, dada uma distribuição bivariada com marginais contínuos , , a cópula correspondente é única (no espaço de intervalo apropriado).F1 F2 F(x,y) F1 F2
O normal bivariado é excepcional
O teorema de Sklar nos diz (essencialmente) que existe apenas uma cópula que produz a distribuição normal bivariada. Este é, apropriadamente chamado, a cópula gaussiana que tem densidade em que o numerador é a distribuição normal bivariada com correlação avaliada em e .[0,1]2
Porém, existem muitas outras cópulas e todas elas fornecerão uma distribuição bivariada com marginais normais, que não é a bivariada normal, usando a transformação descrita na seção anterior.
Alguns detalhes nos exemplos
Observe que se for uma cópula arbitrária com densidade , a densidade bivariada correspondente com marginais normais padrão sob a transformação éC(u,v) c(u,v) F(x,y)=C(Φ(x),Φ(y))
Observe que, aplicando a cópula gaussiana na equação acima, recuperamos a densidade normal bivariada. Mas, para qualquer outra opção de , não o faremos.c(u,v)
Os exemplos na figura foram construídos da seguinte maneira (passando por cada linha, uma coluna por vez):
fonte
library(copula)
kcf <- khoudrajiCopula(copula2 = claytonCopula(6), shapes = fixParam(c(.4, 1), c(FALSE, TRUE)))
# force normal margins
evil <- mvdc(kcf, c("norm", "norm"), list(list(mean = 0, sd =1), list(mean = 0, sd = 1)))
contour(evil, dMvdc, xlim = c(-3, 3), ylim=c(-3, 3))
É verdade que cada elemento de um vetor normal multivariado é ele próprio normalmente distribuído e você pode deduzir suas médias e variações. No entanto, não é verdade que duas variáveis aleatórias da Guassiana sejam distribuídas normalmente em conjunto. Aqui está um exemplo:
Edit: Em resposta ao consenso de que uma variável aleatória que é uma massa pontual pode ser considerada uma variável normalmente distribuída com , estou mudando meu exemplo.σ2=0
Seja e onde é uma variável aleatória . Ou seja, cada um com probabilidade .X∼N(0,1) Y=X⋅(2B−1) B Bernoulli(1/2) Y=±X 1/2
Primeiro, mostramos que tem uma distribuição normal padrão.Y Pela lei da probabilidade total ,
Próximo,
onde é o CDF normal padrão . Similarmente,Φ
Portanto,
então, o CDF de é , portanto .Y Φ(⋅) Y∼N(0,1)
Agora mostramos que não são normalmente distribuídos em conjunto.X,Y Como @cardinal aponta, uma caracterização do normal multivariado é que toda combinação linear de seus elementos é normalmente distribuída. não tem essa propriedade, poisX,Y
Portanto, é uma mistura de uma variável aleatória e uma massa pontual em 0, portanto, não pode ser normalmente distribuída.Y+X 50/50 N(0,4)
fonte
A postagem a seguir contém um esboço de uma prova, apenas para fornecer as principais idéias e começar.
Seja duas variáveis aleatórias gaussianas independentes e sejaz=(Z1,Z2) x=(X1,X2)
Cada , mas como ambas são combinações lineares dos mesmos r.vs independentes, elas são dependentes em conjunto.Xi∼N(μi,σ2i)
Definição Diz-se que um par de r.vs é bivariado normalmente distribuído se puder ser escrito como uma combinação linear de r.vs normais independentes .x=(X1,X2) x=Az z=(Z1,Z2)
Lema Se é um gaussiano bivariado, qualquer outra combinação linear deles é novamente uma variável aleatória normal.x=(X1,X2)
Prova . Trivial, pulado para não ofender ninguém.
Propriedade Se não são correlacionados, eles são independentes e vice-versa.X1,X2
Distribuição deX1|X2
Suponha que sejam os mesmos r.vs gaussianos de antes, mas vamos supor que eles tenham variação positiva e média zero por simplicidade.X1,X2
Se é o subespaço estendido por , deixe e .S X2 XS1=ρσX1σX2X2 XS⊥1=X1−XS1
A decomposição mantém com
Então
Duas variáveis aleatórias gaussianas univariadas são conjuntamente gaussianas se os condicionais e são gaussianos.X | Y Y | XX,Y X|Y Y|X
fonte