Eu enfrentei uma distribuição limitadora com covariância zero entre duas variáveis, mas a correlação delas é . Existe tal distribuição? Como isso pode ser explicado?
Você está certo, posso precisar dar mais detalhes. OK, X e Y são distribuição normal bivariada com diferentes variações e médias (livres de n) mas corr = 1- (1 / n), agora investigue a distribuição limitadora de Yn | Xn = x.
Respostas:
Após um esclarecimento do OP, parece que: a) assumimos que as duas variáveis seguem conjuntamente um normal bivariado eb) nosso interesse está na distribuição condicional, que é então
Então vemos que como , temos , e a variação da distribuição condicional vai para zero. Intuitivamente, se a correlação vai para a unidade, "conhecer " é suficiente para "conhecer " também.ρ n → 1 x yn → ∞ ρn→ 1 x y
Mas em nenhum lugar acima nós obtemos que é zero. Mesmo no limite, a covariância permanecerá igual a . Cov ( S n , X n ) → σ y σ xCov ( Yn, Xn) Cov ( Yn, Xn) → σyσx
Observe que a covariância condicional (e também a correlação condicional) é sempre zero, porque,
Isso acontece porque, ao examinar , transformamos uma das variáveis aleatórias em uma constante e as constantes não co-variam com nada.Xn= x
fonte
Como a covariância depende da escala de e e a correlação não (redimensionada para ), é possível. Por exemplo, se a variação diminuir para zero:Y [ - 1 , - 1 ]X Y [ - 1 , - 1 ]
Se e for a variação de , então e .X= Y σ2x X lim σ 2 x → 0 cor ( X , Y ) = 1limσ2x→0cov(X,Y)=0 limσ2x→0cor(X,Y)=1
Nota 1: quando a correlação é estritamente indefinida porque seu denominador seria igual a 0.σ2x=0
fonte
Tanto quanto posso ver (talvez fora de algumas circunstâncias especiais, mas você não menciona nenhuma), não é possível.
A correlação é a covariância dividida pelo produto dos dois desvios padrão; portanto, se a covariância for zero, a correlação é zero (quando os dois desvios padrão são diferentes de zero) ou indefinida (quando pelo menos um desvio padrão é 0). Não deve ser 1 quando a covariância é 0.
Espero que você tenha cometido algum erro em sua análise ou que sua descrição seja suficientemente clara para discernir a situação corretamente.
fonte
Você provavelmente está tendo dificuldades porque está visualizando os dados como sendo gaussianos.
É possível que todos os dados representem o mesmo ponto (embora seja redundante) e que você tenha duas variáveis com nomes diferentes (aliases um do outro) que compreendem os dados. Isso levaria a covariância zero, e uma correlação de 1 como fundamentalmente, covariância representa o quanto os dados estão espalhados pelo espaço de recurso, enquanto a correlação representa o quanto uma variável depende de outra ou o grau de influência que eles têm entre si. Se os dados não estiverem espalhados, a covariância deve ser zero.
NOTA No entanto, a melhor coisa que você pode fazer com esse conjunto de dados é simplesmente prever todos os pontos como tendo a mesma saída, o que provavelmente dará um viés alto
fonte