Limites na expectativa condicional com margens normais e correlação especificada (Pearson)

8

Vi a seguinte pergunta em outro fórum:

"Suponha que a altura e o peso dos homens adultos possam ser descritos com modelos normais, e que a correlação entre essas variáveis ​​seja 0,65. Se a altura de um homem o coloca no percentil 60, em que percentil você espera que ele pesa?"

Vejo que alguém no fórum em questão já apontou que a pergunta fala sobre as margens serem normais ( height and weight ... can be described with normal models), não sobre normalidade bivariada e, portanto, a pergunta não tem uma única resposta.

Claramente, a resposta dependeria da relação de dependência bivariada real (a cópula), o que me deixou curioso.

Minha pergunta é:

Dadas margens normais e uma correlação populacional especificada ( , uma correlação de Pearson), existe uma maneira razoavelmente direta de encontrar limites em dado ambos normais, com correlação ?ρE(Y|X=xq)X,Yρ

Se houver um valor exato maior e menor para a expectativa condicional, seria bom saber (e de preferência, as circunstâncias em que cada uma ocorre *).

* Tenho fortes suspeitas sobre quais podem ser essas circunstâncias (ou seja, o tipo de dependência que pode estar envolvida; em particular, espero que um tipo específico de distribuição degenerada dê os limites), mas ainda não investiguei esse pensamento em nenhuma hipótese. profundidade. (Acho que alguém já deve saber disso.)

Caso contrário, limites superiores ou inferiores nos valores maiores e menores seriam interessantes.

Não preciso necessariamente de uma resposta algébrica (seria necessário algum algoritmo), embora uma resposta algébrica seja legal.

Respostas aproximadas ou parciais podem ser úteis / úteis.

Se ninguém tiver boas respostas, eu mesmo posso tentar.

Glen_b -Reinstate Monica
fonte

Respostas:

4

Eu acho que não há limites. Essa conclusão se baseia na construção a seguir, que é mais simples de descrever para distribuições contínuas arbitrárias. À medida que avançamos, as condições serão adicionadas até estarmos no caso dos marginais normais.

Então, vamos ser qualquer variável aleatória contínua com função de distribuição . Dado qualquer intervalo semiaberto (que eventualmente se tornará muito estreito), definaF ( a , b )XF(a,b]

ψ:(a,b](,c]

através da

ψ(x)=F1(F(x)F(a)).

Isso está aumentando monotonicamente e evidentemente . Por construção,c=ψ(b)=F1(F(b)F(a))

Pr(X(a,b])=Pr(ψ(X)c).

Estenda para um mapa individual viaψΨ:RR

Ψ|(a,b]=ψ,Ψ|(,c]=ψ1

e caso contrário . A distribuição de é idêntica à de , mas o que foi feito é trocar os valores entre os dois intervalos e .Ψ(x)=xΨ(X)X(a,b](,c]

Figura 1: gráfico de Psi

Exemplo de para .Ψ(a,b]=(1.5,1.75]

Deixe que a correlação de Pearson de ser . (Sem perda de generalidade, podemos supor agora ambos e foram padronizados, porque isso vai mudar nem nem a continuidade do ). Seja qualquer número real, como na pergunta, onde a expectativa condicional de deve ser avaliada. Escolha para o qual mas torne-o tão estreito que seja pequeno. Em seguida, a mudança de para(X,Y)ρ(1,1)XYρXxqY(a,b]xq(a,b]Pr(X(a,b])ρ=E(XY)ρ=E(Ψ(X)Y)pode ser arbitrariamente pequeno. (É preciso um pouco de trabalho para mostrar isso; tudo se resume ao fato de que a expectativa condicional de dada a aumenta relativamente lentamente à medida que diminui. Caso contrário, não seria definido.) No entanto, aplicar changes paraYXc|ba|ρΨE(Y|X=xq)

E(Y|Ψ(X)=xq)=E(Y|X=Ψ(xq)),

que é uma expectativa condicional para com um valor de menor ou igual a .YXc

Figura 2: gráfico do PDF de (Psi (X), Y)

Contornos do PDF. Aqui . A distribuição normal bivariada original recebeu uma correlação de , que reduziu para aproximadamente - o valor alvo - quando as probabilidades nas duas faixas foram trocadas.(a,b]=(1.5,1.75]0.850.5

Quando é uma distribuição normal bivariada, como . Desde , a expectativa condicional de é transferida para para e para para . Uma construção análoga, trocando o intervalo por , empurrará a expectativa condicional de infinitamente longe na outra direção. Ajustando ligeiramente o valor original de podemos compensar a mudança infinitesimal de(X,Y)c|ba|0ρ0Yρ>0+ρ<0(a,b][c,)Yρρisso ocorre, mostrando que não importa qual seja o valor original de , não podemos dizer nada sobre a expectativa condicional de em qualquer ponto específico .ρYX=xq

(A aparente exceção pode ser tratada iniciando-se com, digamos, uma distribuição bivariada com marginais Normais cujo suporte está limitado às linhas .)ρ=0y=±x

whuber
fonte
+1 Isso é muito interessante. Está um pouco relacionado à construção que eu tinha em mente ao escrever a pergunta, mas é mais direcionado a mudar apenas o condicional na vizinhança imediata do quantil e a uma discussão mais ponderada do que eu havia brincado. Sua conclusão parece em primeira leitura correta. Obrigado.
Glen_b -Reinstala Monica
Na verdade, +1 é inadequado aqui.
Glen_b -Reinstala Monica
0

Se entendi sua pergunta corretamente, a resposta depende da "relação de dependência bivariada real (a cópula)" usada.

Bem, existem limites no valor que uma cópula pode ter, certo? Então, por que não usar a cópula de comonotonicidade e contra-monotonicidade para estabelecer os limites.

insira a descrição da imagem aqui

Fonte: Thorsten Schmidt - Lidando com cópulas

Henry E
fonte
A questão é mais restritiva do que os limites das cópulas - você não pode atingir os limites de co- e contra-monotonicidade por causa da restrição de . ρ
Glen_b -Reinstala Monica