Qual método é usado no correlato do Google?

Aqui está uma consulta correlata recente do Google:
http://www.google.com/trends/correlate/search?e=internet+usage&t=weekly#

Como você pode ver na caixa de pesquisa desse link, digitei "uso da Internet" e o Google fez o resto. Ele mostra um valor de 0,9298 como a "correlação" com a consulta "mineração de dados". No entanto, quando leio a página 2 do white paper do Google [PDF] , ele diz:

The objective of Google Correlate is to surface the queries in
the database whose spatial or temporal pattern is most highly correlated
with a target pattern. Google Correlate employs a novel approximate nearest
neighbor (ANN) algorithm over millions of candidate queries in an online
search tree to produce results similar to the batch-based approach employed
by Google Flu Trends but in a fraction of a second. For additional details,
please see the Methods section below....

Então, minha pergunta é: o
Google está usando uma correlação normal de Pearson ou Spearman para encontrar essas coisas ou eles estão usando outra coisa? Se sim, você pode explicar a técnica geral?

==================

Além disso, observe no gráfico que a pesquisa por "uso da Internet" (e "mineração de dados") cai durante os meses de verão e realmente mergulha no Natal. Eu acho que as crianças e seus deveres de casa têm algo a ver com isso.

time-series correlation bill_080
fonte

Esses coeficientes de correlação não são apenas os relatados no tutorial ? ( Consultas correlacionadas da seção )

chl

@chl: Você está certo. Cliquei nas perguntas frequentes, mas fui desviado pelo Whitepaper. Então, eles estão usando a correlação de uma série temporal (não a alteração na série temporal). É como calcular a correlação de um preço das ações, não retornos. Isso é um pouco surpreendente.

bill_080

@chl: embora sua resposta seja um pouco óbvia, ainda é uma resposta, e você deve fazê-lo para que possa ser aceito.

naught101

@ bill_080 Alguma resposta do google sobre por que os dados diferem entre os dois sistemas? Na verdade, eu encontrei esta pergunta buscando uma explicação relacionada com a sua observação

Chandler

@chandler: o Google nunca respondeu o e-mail. Joguei com o Trend e o Correlate por um tempo, mas nenhum deles foi tão útil quanto eu esperava, então segui em frente.

bill_080

Qual método é usado no correlato do Google?

Respostas: