Existe alguma relação entre semelhança de cosseno, correlação de pearson e escore z?

16

Gostaria de saber se existe alguma relação entre essas três medidas. Parece que não consigo estabelecer uma conexão entre eles, consultando as definições (possivelmente porque sou novo nessas definições e estou tendo um tempo difícil para compreendê-las).

Eu sei que o intervalo da semelhança do cosseno pode ser de 0 a 1, e que a correlação de pearson pode variar de -1 a 1, e não tenho certeza do alcance do z-score.

Não sei, no entanto, como um certo valor de similaridade de cosseno poderia lhe dizer algo sobre a correlação de Pearson ou o escore z e vice-versa?

Jaken Herman
fonte
1
pontuação z de quê ? As pontuações z de algumas coisas podem estar relacionadas à correlação de Pearson, as pontuações z de outras coisas podem não estar. Por exemplo, se você padronizar internamente suas variáveis ​​originais, a correlação de Pearson entre x e y é o produto esperado de seus escores z. Ou você pode estar falando sobre escores z das correlações de Pearson (correlações de Pearson menos suas expectativas sob alguma condição, todas divididas pelo erro padrão da correlação de Pearson), o que certamente estaria relacionado à correlação de Pearson.
Glen_b -Reinstate Monica 19/09/16
1
Relação direta: stats.stackexchange.com/a/22520/3277
ttnphns 4/17/17

Respostas:

29

umab Em muitas aplicações que similaridade utilização de co-seno, os vectores são não-negativa (por exemplo, um vector de expressão de frequência para um documento), e neste caso, o co-seno similaridade também será não-negativo.

porqueθ=umab__uma____b__

Para um vetor o vetor " z- score" normalmente é definido como z = x - ˉ xxz onde ˉ x =1

z=x-x¯sx
es 2 x = ¯ ( x - ˉ x ) 2 são a média e desvio padrão dex. Portanto,ztem média 0 e desvio padrão 1, ou seja,zxé aversãopadronizadadex.x¯=1nEuxEusx2=(x-x¯)2¯xzzxx

Para dois vetores e y , seu coeficiente de correlação seria ρ x , y = ¯ ( z x z y )xy

ρx,y=(zxzy)¯

Agora, se o vetor tem média zero, então sua variação será s 2umasuma2=1n__uma__2

uma^=uma__uma__=zuman

umab

n

GeoMatt22
fonte
+1. comentário latexnazi: \|geralmente parece melhor ||e \lVert ... \rVerté a melhor maneira de escrevê-lo.
ameba diz Restabelecer Monica