Que tipo de distribuição é essa? mas

8

Eu enfrentei uma distribuição limitadora com covariância zero entre duas variáveis, mas a correlação delas é . Existe tal distribuição? Como isso pode ser explicado?1


Você está certo, posso precisar dar mais detalhes. OK, X e Y são distribuição normal bivariada com diferentes variações e médias (livres de n) mas corr = 1- (1 / n), agora investigue a distribuição limitadora de Yn | Xn = x.

Behgol
fonte
23
Essa distribuição é chamada de erro computacional .
QuIT - Anony-Mousse
5
Forneça os detalhes para resolver a aparente discrepância. Quais são as circunstâncias?
Glen_b -Reinstala Monica
Forneça ainda mais detalhes sobre a distribuição conjunta de e . Em particular, o que está dando origem a ? XnYnρn=11/n
Mico
Infelizmente, não tenho mais detalhes. Sua pergunta é uma pergunta em que eu estava pensando também. Como ρn depende de n quando as variações estão livres de n? e o que isso significa exatamente?
Behgol
Por que você acha que a covariância é ? 0
Juho Kokkala

Respostas:

5

Após um esclarecimento do OP, parece que: a) assumimos que as duas variáveis ​​seguem conjuntamente um normal bivariado eb) nosso interesse está na distribuição condicional, que é então

YnXn=x  N(μy+σyσxρn(xμx),(1ρn2)σy2)

Então vemos que como , temos , e a variação da distribuição condicional vai para zero. Intuitivamente, se a correlação vai para a unidade, "conhecer " é suficiente para "conhecer " também.ρ n1 x ynρn1xy

Mas em nenhum lugar acima nós obtemos que é zero. Mesmo no limite, a covariância permanecerá igual a . Cov ( S n , X n ) σ y σ xCov(Yn,Xn)Cov(Yn,Xn)σyσx

Observe que a covariância condicional (e também a correlação condicional) é sempre zero, porque,

Cov(Yn,XnXn=x)=E(YnXnXn=x)E(YXn=x)E(XXn=x)

=xE(YnXn=x)xE(YXn=x)=0

Isso acontece porque, ao examinar , transformamos uma das variáveis ​​aleatórias em uma constante e as constantes não co-variam com nada.Xn=x

Alecos Papadopoulos
fonte
Obrigado pela sua resposta. Portanto, é uma distribuição normal sem variação? como seria sua forma?
Behgol 17/10/19
@Behgol veja en.wikipedia.org/wiki/Dirac_delta_function
Alecos Papadopoulos
20

Como a covariância depende da escala de e e a correlação não (redimensionada para ), é possível. Por exemplo, se a variação diminuir para zero:Y [ - 1 , - 1 ]XY[1,1]

Se e for a variação de , então e .X=Yσx2Xlim σ 2 x0 cor ( X , Y ) = 1limσx20cov(X,Y)=0limσx20cor(X,Y)=1

Nota 1: quando a correlação é estritamente indefinida porque seu denominador seria igual a 0.σx2=0

Pieter
fonte
Você está certo, talvez eu deva dar mais detalhes. OK X e Y são distribuição normal divergente com variância e média diferentes (livre de n) mas corr = 1- (1 / n), agora investigue a distribuição limitadora de Yn | Xn = x.
Behgol
A redação "Como a covariância depende da escala" implica que isso seja dado na pergunta. No entanto, isso parece ser mais do que a questão implica. Parece-me que você está postulando que pode ser assim, com conclusões declaradas. Corrija-me se isso estiver errado.
Nick Cox
18

Tanto quanto posso ver (talvez fora de algumas circunstâncias especiais, mas você não menciona nenhuma), não é possível.

A correlação é a covariância dividida pelo produto dos dois desvios padrão; portanto, se a covariância for zero, a correlação é zero (quando os dois desvios padrão são diferentes de zero) ou indefinida (quando pelo menos um desvio padrão é 0). Não deve ser 1 quando a covariância é 0.

Espero que você tenha cometido algum erro em sua análise ou que sua descrição seja suficientemente clara para discernir a situação corretamente.

Glen_b -Reinstate Monica
fonte
1

Você provavelmente está tendo dificuldades porque está visualizando os dados como sendo gaussianos.

É possível que todos os dados representem o mesmo ponto (embora seja redundante) e que você tenha duas variáveis ​​com nomes diferentes (aliases um do outro) que compreendem os dados. Isso levaria a covariância zero, e uma correlação de 1 como fundamentalmente, covariância representa o quanto os dados estão espalhados pelo espaço de recurso, enquanto a correlação representa o quanto uma variável depende de outra ou o grau de influência que eles têm entre si. Se os dados não estiverem espalhados, a covariância deve ser zero.

NOTA No entanto, a melhor coisa que você pode fazer com esse conjunto de dados é simplesmente prever todos os pontos como tendo a mesma saída, o que provavelmente dará um viés alto

RS Nikhil Krishna
fonte
2
Parece haver algumas coisas diferentes acontecendo nesta resposta, e eu tenho dificuldade em ver o relacionamento. Por exemplo, como o parágrafo 1 é relevante? Qual a relevância do parágrafo 3? Além disso, como você chega à covariância zero no parágrafo 2?
Richard Hardy
Obrigado @ Richard Hardy por apontar isso. Uma das outras respostas sugeriu inicialmente uma solução gaussiana. É por isso que o parágrafo 1. No parágrafo 3, estou apenas dando minha opinião sobre o que ele pode fazer com esse conjunto de dados. Fundamentalmente, covariância representa como os dados estão espalhados pelo espaço de recursos. Se os dados não estiverem espalhados em, a covariância deve ser zero. Também adicionei esta resposta
RS Nikhil Krishna 16/10