Algum exemplo de (aproximadamente) variáveis ​​independentes que são dependentes de valores extremos?

14

Eu estou procurando um exemplo de 2 variáveis ​​aleatórias X , Y tais que

|cor(X,Y)|0 0

mas quando consideramos a parte final das distribuições, elas são altamente correlacionadas. (Eu tento evitar 'correlacionado' / 'correlação' para a cauda porque ela pode não ser linear).

Provavelmente use isso:

|cor(X,Y)|0 0

onde X é condicional em X>90% da população de X e Y é definido no mesmo sentido.

Kmz
fonte
8
Variáveis ​​independentes que são dependentes? Meu cérebro simplesmente explodiu. Você não pode fazer esse tipo de pergunta na segunda de manhã
Aksakal 03/10
1
Dada a resposta votada, este Q parece responsável.
gung - Restabelece Monica
1
Para ajudar isso a fazer sentido para as pessoas, considere o quanto você se importa com questões relacionadas a armas e o quanto você gosta / odeia a NRA. A correlação provavelmente será próxima de zero. As pessoas que mais se preocupam com questões relacionadas a armas podem amar ou odiar a NRA. Mas eles serão muito dependentes. As pessoas que mais se preocupam com os problemas com armas nunca estarão no meio do espectro pró-NRA / anti-NRA. As pessoas na extremidade superior ou inferior do espectro pró-NRA / anti-NRA tendem a se importar mais com os problemas com as armas do que as pessoas do meio.
David Schwartz
1
Sinto muito por declarar a pergunta incerta. Eu só quero visualizar como isso funciona para algumas distribuições independentes que possuem um tipo de extrema dependência (não necessariamente correlação).
Kmz
2
Existem inúmeras cópulas com fraca dependência geral, mas forte dependência da cauda; a correlação geral exata seria afetada pela distribuição dos marginais.
Glen_b -Reinstala Monica

Respostas:

23

Aqui está um exemplo em que e têm marginais normais.YXY

Deixei:

XN(0,1)

Condicional em , deixe se ou , caso contrário, para alguma constante .Y = X | X | > ϕ Y = - X ϕXY=X|X|>ϕY=Xϕ

Você pode mostrar que, independentemente de , temos marginalmente:ϕ

YN(0,1)

Existe um valor de tal que . Se então .ϕcor(X,Y)=0ϕ=1.54cor(X,Y)0

No entanto, e não são independentes e os valores extremos de ambos são perfeitamente dependentes. Veja a simulação em R abaixo e o gráfico a seguir.XY

Nsim <- 10000
set.seed(123)

x <- rnorm(Nsim)
y <- ifelse(abs(x)>1.54,x,-x)

print(cor(x,y)) # 0.00284 \approx 0

plot(x,y)

extreme.x <- which(abs(x)>qnorm(0.95))
extreme.y <- which(abs(y)>qnorm(0.95))
extreme.both <- intersect(extreme.x,extreme.y)

print(cor(x[extreme.both],y[extreme.both])) # Exactly 1

insira a descrição da imagem aqui

Chris Haug
fonte
1
(+1) Se você deseja que a distribuição não seja apenas não correlacionada, mas também não muito dependente, é possível fazer uma modificação disso que substitui a troca de limite rígido por uma difusa. É mais difícil alinhar a matemática, mas é factível.
Matthew Graves
1
Obrigado Chris Haug! Sua ideia me ajuda a visualizar o que estou fazendo.
Kmz