Exemplo de duas variáveis ​​normais * correlacionadas * cuja soma não é normal

10

Estou ciente de alguns bons exemplos de pares de variáveis ​​aleatórias correlacionadas que são marginalmente normais, mas não são conjuntamente normais. Veja esta resposta de Dilip Sarwate e esta do cardeal .

Também estou ciente de um exemplo de duas variáveis ​​aleatórias normais cuja soma não é normal. Veja esta resposta por Macro . Mas neste exemplo, as duas variáveis ​​aleatórias não são correlacionadas.

Existe um exemplo de duas variáveis ​​aleatórias normais que possuem covariância diferente de zero e cuja soma não é normal? Ou é possível provar que a soma de quaisquer duas variáveis ​​aleatórias normais correlatas, mesmo que não sejam normais bivariadas, deve ser normal?

[Contexto: Eu tenho uma pergunta de lição de casa que pede a distribuição de onde X e Y são normais padrão com correlação ρ . Eu acho que a pergunta pretendia especificar que eles são bivariados normais. Mas estou pensando se algo pode ser dito sem essa suposição extra para ρ diferente de zero.]aX+bYXYρρ

Obrigado!

mww
fonte
5
A resposta do cardeal, que você cita, já contém uma solução: veja o canto superior direito em seu painel de exemplos.
whuber
Por favor, você pode explicar como? Ele especifica uma distribuição conjunta , que gera dois marginais normais. Não está claro para mim que a soma dos dois marginais normais não seja normal, e é isso que estou procurando. (Veja também o meu comentário sobre a resposta de Glen_b abaixo.)
MWW
3
Apenas pela figura, é óbvio que a densidade da soma em zero é zero (porque a linha cruza o gráfico em um único ponto, que mede zero), enquanto a soma em si é obviamente simétrica quanto a isso. zero, mostrando que zero é o centro da distribuição da soma. Essa distribuição não pode ser Normal porque as distribuições normais têm densidades diferentes de zero em seus centros. x+y=0 0
whuber

Respostas:

11

Quase qualquer cópula bivariada produzirá um par de variáveis ​​aleatórias normais com alguma correlação diferente de zero (algumas darão zero, mas são casos especiais). A maioria (quase todos) produzirá uma soma não normal.

Em algumas famílias de cópulas, qualquer correlação de Spearman desejada (população) pode ser produzida; a dificuldade é apenas encontrar a correlação de Pearson para margens normais; é factível em princípio, mas a álgebra pode ser bastante complicada em geral. [No entanto, se você tiver a correlação de Spearman da população, a correlação de Pearson - pelo menos para margens de cauda leve como o gaussiano - pode não estar muito longe disso em muitos casos.]

Todos os dois primeiros exemplos do enredo do cardeal, com exceção dos dois primeiros, devem fornecer somas não normais.


Alguns exemplos - os dois primeiros são da mesma família de cópulas que o quinto exemplo de distribuição bivariada do cardeal, o terceiro é degenerado.

Exemplo 1:

Cópula de Clayton ( )θ=-0,7

histogramas de margens normais, soma não normal e gráfico da distribuição bivariada

Aqui a soma tem um pico muito distinto e uma inclinação bastante forte

 

Exemplo 2:

Cópula de Clayton ( )θ=2

histogramas de margens normais, soma não normal e gráfico da distribuição bivariada

Aqui a soma é levemente inclinada. Caso isso não seja muito óbvio para todos, aqui eu virei a distribuição (ou seja, temos um histograma de em roxo claro) e sobrepondo-o para que possamos ver a assimetria mais claramente:-(x+y)

histograma sobreposto de x + y e - (x + y)

 

X=-XY=-Y

Por outro lado, se negarmos um deles, mudaríamos a associação entre a força da assimetria com o sinal da correlação (mas não a direção da mesma).

Também vale a pena brincar com algumas cópulas diferentes para entender o que pode acontecer com a distribuição bivariada e as margens normais.

As margens gaussianas com uma cópula t podem ser experimentadas, sem se preocupar muito com detalhes de cópulas (gerar a partir de bivariada correlacionada t, o que é fácil, depois transforme em margens uniformes por meio da transformação integral de probabilidade, depois transforme margens uniformes em gaussiano via cdf normal inverso). Ele terá uma soma não normal, mas simétrica. Portanto, mesmo se você não tiver bons pacotes de copula, ainda poderá fazer algumas coisas com bastante facilidade (por exemplo, se eu estivesse tentando mostrar um exemplo rapidamente no Excel, provavelmente começaria com o t-copula).

-

Exemplo 3 : (é mais parecido com o que eu deveria ter começado inicialmente)

vocêV=você0 0você<1 12V=32-você1 12você1 1vocêVX=Φ-1 1(você),Y=Φ-1 1(V)X+Y

insira a descrição da imagem aqui

Nesse caso, a correlação entre eles é de cerca de 0,66.

XY

você(1 12-c,1 12+c)c[0 0,1 12]V


Algum código:

library("copula")
par(mfrow=c(2,2))

# Example 1
U <- rCopula(100000, claytonCopula(-.7))
x <- qnorm(U[,1])
y <- qnorm(U[,2])
cor(x,y)
hist(x,n=100)
hist(y,n=100)
xysum <- rowSums(qnorm(U))
hist(xysum,n=100,main="Histogram of x+y")
plot(x,y,cex=.6,
       col=rgb(0,100,0,70,maxColorValue=255),
       main="Bivariate distribution")
text(-3,-1.2,"cor = -0.68")
text(-2.5,-2.8,expression(paste("Clayton: ",theta," = -0.7")))

O segundo exemplo:

#--
# Example 2:
U <- rCopula(100000, claytonCopula(2))
x <- qnorm(U[,1])
y <- qnorm(U[,2])
cor(x,y)
hist(x,n=100)
hist(y,n=100)
xysum <- rowSums(qnorm(U))
hist(xysum,n=100,main="Histogram of x+y")
plot(x,y,cex=.6,
    col=rgb(0,100,0,70,maxColorValue=255),
    main="Bivariate distribution")
text(3,-2.5,"cor = 0.68")
text(2.5,-3.6,expression(paste("Clayton: ",theta," = 2")))
#
par(mfrow=c(1,1))

Código para o terceiro exemplo:

#--
# Example 3:
u <- runif(10000)
v <- ifelse(u<.5,u,1.5-u)
x <- qnorm(u)
y <- qnorm(v)
hist(x+y,n=100)
Glen_b -Reinstate Monica
fonte
X+Y=2EuZ+(1 1-Eu)você+(1 1-Eu)VEu=0 0você+VEu=1 12Zdistribuição não é normal.
MWW
ρ
Substituí o exemplo por dois exemplos específicos usando cópulas de Clayton
Glen_b -Reinstate Monica
Fabuloso - obrigado! Agradecimentos especiais para o código R.
MWW
Adicionei um terceiro exemplo e, no final, descrevi uma maneira de obter algo parecido com o que estava originalmente tentando - uma maneira de obter uma correlação sintonizável entre -1 e 1 (além de casos especiais nas extremidades), mas para os quais a soma não é normal.
Glen_b -Reinstala Monica
-1

Eu vim com um exemplo. X é a variável normal padrão e Y = -X. Então X + Y = 0, que é constante. Alguém pode confirmar que é um contra-exemplo?

Sabemos que se X, Y são conjuntamente normais, então a soma também é normal. Mas e se a correlação deles for -1 ??

Estou um pouco confuso sobre isso. THX.

Zirui Zhang
fonte
Você obtém a mesma coisa quando X = Y e, em seguida, XY = 0. Estas são distribuições normais que não são normais bivariadas. Portanto, a propriedade da qual as combinações lineares são normais, que se aplica ao normal bivariado, não precisa ser aplicada.
Michael R. Chernick
σ0 0