Qual é a correlação se o desvio padrão de uma variável for 0?

15

Pelo que entendi, podemos obter correlação normalizando a covariância usando a equação

ρi,j=cov(Xi,Xj)σiσj

onde σi=E[(Xiμi)2] é o desvio padrão deXi.

Minha preocupação é: e se o desvio padrão for igual a zero? Existe alguma condição que garanta que não possa ser zero?

Obrigado.

chepukha
fonte
11
Nenhuma variável com desvio padrão 0 poderia ser correlacionada com outra variável (não constante). Correlação é uma medida de como valores grandes / pequenos em uma variável correspondem a valores grandes / pequenos em outra variável - se uma das variáveis ​​for igual a uma constante com probabilidade 1 (uma consequência de ter o desvio padrão 0), ela poderá ' possivelmente fornecer informações sobre se a outra variável é pequena ou grande. Não sei qual é a convenção, mas parece que a correlação deve ser definida como 0 nesse caso.
Macro
Muito obrigado Macro. Penso que a sua ideia é a mesma que a resposta abaixo. No entanto, não pude votar no seu comentário devido à limitação de pontos. Obrigado.
chepukha
4
Você já aceitou uma resposta e, portanto, escreverei apenas um comentário. Se uma variável aleatória tem desvio padrão σ Y = 0 , então cov ( X , Y ) = E [ ( X - μ X ) ( Y - μ Y ) ] = 0 para qualquer outra variável aleatória X (desde ( Y - μ Y ) = 0 com probabilidade 1YσY=0
cov(X,Y)=E[(XμX)(YμY)]=0
X(Y-μY)=0 01) Assim, a definição do coeficiente de correlação fornece a forma indeterminada0ρX,Y=cov(X,Y)σXσY . É convencional paradefinirρX,Yser igual a0, neste caso, e isto pode ser defendida em razão do valor limite deρX,YcomoσY0etc0 00 0 ρX,Y0 0ρX,YσY0 0
Dilip Sarwate
6
@ Dilip, se for uma resposta, deve ser uma resposta. Não importa se uma resposta já foi aceita.
Andy W
1
@Dilip O problema com o formato 0 é que, mesmo que possa ser feito para ter um valor definido por meio de uma operação de limitação, o valor depende decomovocê assume o limite. Daí, o argumento de queρX,Y=0é incompleto (e pouco convincente). Você pode citar uma fonte que adota esta convenção e a apoia por um motivo válido? 0 00 0ρX,Y=0 0
whuber

Respostas:

14

É verdade que, se um de seus SDs é 0, essa equação é indefinida. No entanto, uma maneira melhor de pensar sobre isso é que, se um dos seus SDs é 0, não há correlação. Em termos conceituais frouxos, uma correlação mostra como uma variável se move à medida que a outra variável se move. Um SD de 0 implica que a variável não está 'se movendo'. Você precisaria ter um vetor de constante, como rep(constant, n_times).

Repor a Monica
fonte
Muito obrigado. Eu acho que faz sentido. É interessante que eu não tenha visto nenhum livro mencionar esse caso.
chepukha
@gung Assim, é esta uma limitação na definição de coeficiente de correlação, refiro-me à equação de correlação pode ter dois valores, um é como dado na equação acima e 0 quando SD de uma das variáveis é 0.
prashanth
@ prashanth, eu suponho.
gung - Restabelece Monica
2

A outra coisa a se pensar são as suposições subjacentes quando falamos de médias e desvios-padrão e correlações.

Se estamos falando de uma amostra de dados, uma suposição comum é que os dados são (pelo menos aproximadamente) normalmente distribuídos ou podem ser transformados de forma que sejam (por exemplo, através de uma transformação de log). Se você observar um desvio padrão de zero, há dois cenários: o desvio padrão é de fato diferente de zero, mas muito pequeno e, portanto, o conjunto de dados que você possui possui amostras com todos os valores médios (isso pode, por exemplo, ocorrer se você estiver medindo dados em um nível aproximado de precisão); ou o modelo está especificado incorretamente.

Nesse segundo cenário, o desvio padrão e, consequentemente, a correlação, é uma medida sem sentido.

De um modo mais geral, as distribuições subjacentes devem ter segundos momentos finitos e, portanto, desvios padrão diferentes de zero, para que a correlação seja um conceito válido.

tdc
fonte
Vale a pena notar que a pergunta original é sobre distribuições (teóricas), não sobre dados.
whuber
Se for esse o caso, um desvio padrão de zero implicaria uma distribuição degenerada com medida apenas na média (ou seja, a função constante) ... novamente o desvio padrão faz sentido apenas que a distribuição subjacente seja normal. Se o desvio padrão for zero, o PDF do Gaussian não está definido corretamente e, portanto, não é permitido no modelo.
tdc
Estou surpreso com a aparência de gaussianos no seu comentário, Tom. Isso parece uma restrição desnecessária. Exigir a existência de um pdf também parece restritivo (afinal, nenhuma distribuição discreta possui um pdf). Observe também que o SD é bem definido - "significativo" - sempre que o segundo momento é finito, e isso inclui átomos de probabilidade (suas funções "Dirac delta").
whuber
Ok, eu concordo que provavelmente estava sendo excessivamente restritivo, mas geralmente é isso que as pessoas querem dizer com SD. por exemplo, de Wolfram: "O desvio padrão pode ser definido para qualquer distribuição com dois primeiros momentos finitos, mas é mais comum supor que a distribuição subjacente seja normal". Você considera que, se o DP = 0 para uma das variáveis, as suposições básicas subjacentes ao conceito estatístico de correlação não estão sendo atendidas?
tdc
Sim, Tom, sua última declaração está pronta e eu a aceito com prazer. No entanto, a ideia que ela expressa não aparece com muito destaque na sua resposta; se estiver lá, está oculto nos comentários sobre distribuições normais, logs, funções delta e o foco nos dados, e não nas próprias distribuições. Aliás, é preciso ter cuidado com as declarações estatísticas que aparecem no site da Wolfram: ela é tão fortemente orientada para a matemática que suas caracterizações sobre a prática estatística podem ser questionáveis. Aqui está completamente errado: o uso do SD vai muito além das configurações de distribuição normal.
whuber
2

Uma correlação é o cosseno do ângulo entre dois vetores. Dizer que o desvio padrão para Y é zero é o mesmo que dizer que a média Y do vetor (Y) é zero (ou, mais rigorosamente, que representa zero no espaço vetorial apropriado). Então a pergunta se torna "O que se pode dizer sobre o ângulo (cosseno do) entre o vetor zero e o vetor X-mean (X)?". De maneira mais geral, em qualquer espaço vetorial com um produto interno, o que se entende pelo ângulo entre o vetor zero e algum outro vetor? Há apenas uma resposta para isso, na minha opinião, e é que o conceito de "ângulo" nessa situação não tem sentido, e, portanto, o conceito de correlação nessa situação não tem sentido.

David Epstein
fonte
0

Isenção de responsabilidade, percebo que já existe uma resposta de qualidade aceita, portanto essa deve ser uma resposta, mas não tenho pontos de experiência para permitir isso. @Dilip mencionou que você pode definir a correlação como 0 para a convenção, mas isso parece problemático, pois teria uma interpretação muito diferente de uma correlação que é verdadeiramente zero (com SDs diferentes de zero). A pergunta original diz "se o SD de uma variável é zero". Se pararmos e pensarmos na definição de 'variável', obteremos um caminho muito mais direto para a resposta. Uma variável com 0 SD não é uma variável, é uma constante. Portanto, nesse caso, você não tem duas variáveis; portanto, conceitualmente, não faz sentido definir uma correlação.

Skye Buckner-Petty
fonte
Se você não tem pontos suficientes para comentar, não deve comentar através de respostas.
Michael R. Chernick 23/05