Similaridade de duas transformações discretas de Fourier?

14

Na modelagem climática, você está procurando modelos que possam retratar adequadamente o clima da Terra. Isso inclui mostrar padrões semi-cíclicos: coisas como a oscilação do sul de El Nino. Mas a verificação do modelo ocorre geralmente em períodos relativamente curtos, onde há dados observacionais decentes (últimos ~ 150 anos). Isso significa que seu modelo pode estar exibindo os padrões corretos, mas estar fora de fase, de modo que comparações lineares, como correlação, não atinjam o desempenho do modelo.

As transformações discretas de Fourier são comumente usadas para analisar dados climáticos ( aqui está um exemplo ), a fim de captar esses padrões cíclicos. Existe alguma medida padrão da similaridade de dois DFTs, que poderia ser usada como uma ferramenta de verificação (isto é, uma comparação entre o DFT do modelo e o das observações)?

Faria sentido obter a integral do mínimo dos dois DFTs normalizados por área (usando valores reais absolutos)? Eu acho que isso resultaria em uma pontuação , onde x = 1x[0 0,1]x=1exatamente os mesmos padrões x=0 0padrões totalmente diferentes. Quais podem ser as desvantagens de um método assim?

naught101
fonte
3
Você já pensou em usar a coerência (no sentido de processamento do sinal, não na estatística), uma medida espectral cruzada? Não tenho certeza se esse é o tipo de medida que você está procurando.
jonsca
@jonsca: Coisas interessantes. Certamente não estou procurando causalidade, mas posso ver como isso pode ser útil. O exemplo nessa página da wikipedia é um pouco estranho (por que não inclui a pressão barométrica como variável de modelo?). Além disso, eu não tenho certeza de onde a figura de 90% vem de ...
naught101
Esta é uma boa pergunta. Esse exemplo foi adicionado ao artigo desde a última vez que o li. Eu suspeito que pode ter a ver com a coerência de ser centrado no por dia e por 2 frequências dia (portanto, amarrado a um fenômeno das marés por dia), mas isso é apenas um palpite ...
jonsca
(Eu não sei se eles integrados ao descobrir que 90%, embora)
jonsca

Respostas:

12

A coerência espectral, se usada corretamente, faria isso. A coerência é calculada em cada frequência - e, portanto, é um vetor. Portanto, uma soma de uma coerência ponderada seria uma boa medida. Você normalmente gostaria de ponderar as coerências em frequências que possuem alta energia na densidade espectral de potência. Dessa forma, você estaria medindo as semelhanças nas frequências que dominam a série temporal em vez de ponderar a coerência com um grande peso, quando o conteúdo dessa frequência na série temporal é insignificante.

Então, em palavras simples - a idéia básica é encontrar as frequências nas quais a amplitude (energia) nos sinais é alta (interpretar como as frequências que constituem predominantemente cada sinal) e comparar as semelhanças nessas frequências com um peso maior e compare os sinais nas demais frequências com um peso menor.

A área que lida com questões desse tipo é chamada de análise espectral cruzada. http://www.atmos.washington.edu/~dennis/552_Notes_6c.pdf é uma excelente introdução à análise espectral cruzada.

Atraso ideal: veja também a minha resposta aqui: Como correlacionar duas séries temporais, com possíveis diferenças de tempo

Isso trata de encontrar o atraso ideal, usando a coerência espectral. R possui funções para calcular densidades espectrais de potência, correlações automáticas e cruzadas, transformadas de Fourier e coerência. Você precisa codificar corretamente para encontrar o atraso ideal para obter o máximo. coerência ponderada. Dito isto, um código para ponderar o vetor de coerência usando a densidade espectral também deve ser escrito. Em seguida, você pode resumir os elementos ponderados e calculá-los para obter a semelhança observada no atraso ideal.

carro fúnebre
fonte
1
Esse é um excelente recurso! Trata-se de hipótese de testar bem, que um monte de material sobre a coerência convenientemente evita
jonsca
2

Você já tentou outra abordagem para detecção / modelagem de sinais climáticos, como uma análise de wavelets? O grande problema que pode surgir com a DFT na análise climática é o que você menciona: as oscilações não são perfeitamente periódicas e geralmente têm períodos de tempo diferentes, para que possam ter muitos intervalos de oscilação diferentes, o que é bastante confuso da perspectiva da Transformação de Fourier .

Uma análise de wavelets é mais adequada aos sinais climáticos porque eles permitem verificar diferentes períodos de oscilação; assim como diferentes frequências são tocadas em diferentes momentos por um instrumento musical, você pode verificar diferentes frequências em diferentes intervalos de tempo com a transformada wavelet.

Se você estiver interessado, este artigo de Lau & Weng (1995) deve apagar a maioria das suas dúvidas sobre esse método. A parte mais interessante é que a transformação wavelet de um modelo versus a dos dados é quase diretamente comparável, porque você pode comparar diretamente o período de tempo que seu modelo prevê, deixando de fora todos os intervalos espúrios de oscilação que ele não faz.

PS: Devo acrescentar que queria postar isso como um comentário, porque na verdade não é o que o OP está pedindo, mas meu comentário seria muito grande e decidi publicá-lo como uma resposta que pode ser útil como uma abordagem alternativa à dos DFTs.

Néstor
fonte
1

Votei e segundo no uso de wavelet e análise baseada em espectrograma como uma alternativa ao dft. Se você pode decompor sua série em compartimentos localizados com frequência de tempo, isso reduzirá os quatro problemas de aperiodicidade e não estacionariedade, além de fornecer um bom perfil de dados discretizados para comparação.

Uma vez que os dados são mapeados para um conjunto tridimensional de energia espectral versus tempo e frequência, a distância euclidiana pode ser usada para comparar perfis. Uma combinação perfeita se aproximaria da distância limite inferior de zero. * Você pode examinar as áreas de mineração de dados de séries temporais e reconhecimento de fala para abordagens semelhantes.

* observe que o processo de classificação de wavelet filtrará um pouco o conteúdo das informações. Se não houver perda nos dados comparados, pode ser mais adequado comparar usando a distância euclidiana no domínio do tempo.

tapinha
fonte