Falha ao implementar o algoritmo Goertzel em Python

7

Após algumas perguntas sobre o stackoverflow , tentei implementar um algoritmo Goertzel em Python. Mas isso não funciona: https://gist.github.com/4128537

import math

def goertzel(samples, sample_rate, f_start, f_end):
    """
    Implementation of the Goertzel algorithm, useful for calculating individual
    terms of a discrete Fourier transform.
    """
    window_size = len(samples)
    f_step = sample_rate / float(window_size)
    # Calculate which DFT bins we'll have to compute
    k_start = int(math.ceil(f_start / f_step))
    k_end = int(math.floor(f_end / f_step))

    if k_end > window_size - 1: raise ValueError('frequency out of range %s' % k_end)

    # For all the bins between `f_start` and `f_end`, calculate the DFT
    # term
    n_range = range(0, window_size)
    freqs = []
    results = []
    for k in range(k_start, k_end + 1):
        # Bin frequency and coefficients for the computation
        f = k * f_step
        w_real = 2.0 * math.cos(2.0 * math.pi * f)
        w_imag = math.sin(2.0 * math.pi * f)

        # Doing the calculation on the whole sample
        d1, d2 = 0.0, 0.0
        for n in n_range:
            y  = samples[n] + w_real * d1 - d2
            d2, d1 = d1, y

        # Storing results `(real part, imag part, power)`
        results.append((
            0.5 * w_real * d1 - d2, w_imag * d1,
            d2**2 + d1**2 - 2 * w_real * d1 * d2)
        )
        freqs.append(f)
    return freqs, results

if __name__ == '__main__':
    # quick test
    import numpy as np
    import pylab

    t = np.linspace(0, 1, 44100)
    sine_wave = np.sin(2*np.pi*441*t)[:1024]
    freqs, results = goertzel(sine_wave, 44100, 0, 22049)
    print np.array(results)
    pylab.plot(freqs, np.array(results)[:,2])
    pylab.show()

Eu sou iniciante neste tópico, então não tenho idéia do que poderia estar errado lá. Qualquer conselho seria bem vindo.

EDITAR

Aqui está o que eu recebo ao plotar o poder ... como você pode notar, a frequência 440 que deve aparecer não está lá:

Aqui está o que eu recebo ao executar o código

sebpiq
fonte

Respostas:

7

Basta dar uma olhada e, a partir da definição do algoritmo de Goertzel na wikipedia , a frequência no peso do cosseno deve ser uma frequência normalizada (como na DFT, a propósito). Se você modificar seu código como abaixo, deverá obter a saída correta (observe também que o cálculo da potência levou a potências negativas -sic-, a remoção de um fator redundante 2 também resolveu esse problema).

O código modificado:

import math

def goertzel(samples, sample_rate, f_start, f_end):
    """
    Implementation of the Goertzel algorithm, useful for calculating individual
    terms of a discrete Fourier transform.
    """
    window_size = len(samples)
    f_step = sample_rate / float(window_size) # JLD: in Hz
    # Calculate which DFT bins we'll have to compute
    k_start = int(math.ceil(f_start / f_step))
    k_end = int(math.floor(f_end / f_step))

    if k_end > window_size - 1: raise ValueError('frequency out of range %s' % k_end)

    # For all the bins between `f_start` and `f_end`, calculate the DFT
    # term
    n_range = range(0, window_size)
    freqs = []
    results = []
    f_step_normalized = 1./window_size # JLD: step in normalized frequency 
    for k in range(k_start, k_end + 1):
        # Bin frequency and coefficients for the computation
        f = k * f_step_normalized # JLD: here you need the normalized frequency
        w_real = 2.0 * math.cos(2.0 * math.pi * f)
        w_imag = math.sin(2.0 * math.pi * f)

        # Doing the calculation on the whole sample
        d1, d2 = 0.0, 0.0
        for n in n_range:
            y  = samples[n] + w_real * d1 - d2
            d2, d1 = d1, y

        # Storing results `(real part, imag part, power)`
        results.append((
            0.5 * w_real * d1 - d2, w_imag * d1,
            d2**2 + d1**2 - w_real * d1 * d2) # removed factor 2: already in w_real!
        )
        freqs.append(f * sample_rate)
    return freqs, results

if __name__ == '__main__':
    # quick test
    import numpy as np
    import pylab

    ##t = np.linspace(0, 1, 44100)
    # JLD: if you do this, the sampling rate is not exactly 44100 anymore:
    #    linspace includes the boundaries 0 and 1, and there are therefore
    #    44100 samples for a bit more than 1 second...
    sample_rate = 44100 # in Hz
    t = np.arange(sample_rate) / np.double(sample_rate) # in seconds
    # JLD: with 1000 samples, a sine at 441Hz leads to a DFT with only one
    # non-nul component:
    sine_wave = np.sin(2*np.pi*441*t)[:1000]  
    freqs, results = goertzel(sine_wave, sample_rate, 0, 22049)
    print np.array(results)
    pylab.figure()
    pylab.clf()
    pylab.plot(np.array(freqs),
               np.array(results)[:,0]**2 + np.array(results)[:,1]**2,
               marker='x',
               label='computed power')
    pylab.plot(np.array(freqs),
               np.array(results)[:,0]**2 + np.array(results)[:,1]**2,
               linestyle='--',
               marker='o',
               label='returned power')
    pylab.xlim([0,1000])
    pylab.ylabel('Power')
    pylab.xlabel('Frequency (Hz)')
    pylab.legend()
    pylab.show()

Não testei completamente esse código e não posso garantir que ele esteja livre de erros, mas, para seu exemplo simples, ele parece funcionar bem. Eu obtenho a seguinte figura:

saída do código python acima

Espero que ajude!

Saudações!

Jean-Louis!

Jean-louis Durrieu
fonte
Aahhh! Merci infiniment :) Estou lutando com isso há mais de um dia. Uma última coisa, porém: eu gostaria de entender essa coisa de frequência normalizada ... você poderia explicar em breve ou me indicar uma explicação simples?
sebpiq
@sebpiq De rien! Existem algumas dicas sobre frequências normalizadas e frequências no artigo da DTFT . Em resumo, uma maneira de vincular frequências normalizadas e "reais": com o DFT, você projeta seu sinal em , onde é homogêneo para amostras e , a frequência normalizada, para ciclos por amostras . Deixe ser a taxa de amostragem, em seguida, é o tempo em segundos , e em Hz (= ciclos por segundo ). Qualquer curso DSP provavelmente explicará isso mais detalhadamente. expj2πkNnnkNfst=nfsf=kNfs
Jean-louis Durrieu
Ok ... acho que entendi. Acho que preciso de uma atualização DSP :) Muito obrigado pela ajuda.
sebpiq