Para valores complexos, por que usar conjugado complexo em convolução?

8

Retirado de Adaptive Filter Theory (2014), escrito por Haykin página 110:

y(n)=k=0wku(nk),n=0,1,2,...

Onde u e wsão valores complexos. Minha pergunta é por que usar conjugado complexo dewk? A resposta encontrada no livro diz "..., em terminologia complexa, o termowku(nk)representa a versão escalar de um produto interno do coeficiente de filtrowk e a entrada do filtro u(nk)" . Eu ainda não entendo, você pode elaborar mais sobre esta resposta?

Ηλεκτρολόγος Μηχανικός
fonte

Respostas:

10

Acontece que convolução e correlação estão intimamente relacionadas. Para sinais reais (e sinais de energia finita):

Convolução: y[n]h[n]x[n]=m=h[nm]x[m]

Correlação: Ryx[n]m=y[n+m]x[m]=y[n]x[m]

Agora, em espaços métricos, gostamos de usar esta notação:

Rxy[n]x[m],y[n+m]=m=x[m]y[n+m]

o x,yé o produto interno dos vetoresx e y Onde x={x[n]} e y={y[n]}. Também gostamos de definir a norma de um vetor como

xx,x=m=x[m]x[m]=m=x2[m]

e isso se parece muito com o comprimento euclidiano de um vetor com um número infinito de dimensões. Tudo isso funciona muito bem para o caso em que os elementosx[n] do vetor xsão todos reais. A normax é sempre real e não negativo.

Portanto, se generalizarmos e permitirmos os elementos de x valor complexo, se a mesma definição de norma for usada,

xx,x

então a definição do produto interno precisa ser modificada um pouco:

x,y=m=x[m]y[m]

Então se x possui elementos de valor complexo, a norma aparece como:

xx,x=m=x[m]x[m]=m=|x[m]|2

Então, evidentemente, Haykin está apenas retornando a definição de produto interno à definição de convolução.

Robert Bristow-Johnson
fonte
4

O uso do conjugado na formação do filtro adaptativo não é necessário. No entanto, se você não escrever a saída usando um conjugado, é muito fácil esquecer que as variáveis ​​com as quais você está lidando são complexas. Se você escrever

h(n)=k=0wk(n)u(nk)
então não está claro se você está lidando com quantidades complexas.

Como Robert já apontou, a definição de correlação precisa ser atualizada para lidar com dados complexos se você estiver acostumado a vê-los definidos apenas para dados reais.

Outro motivo para usar o conjugado como esse é simplificar a obtenção de derivados para encontrar a solução para o filtro adaptativo. Suponha que tenhamos uma função objetiva com valor realJ(w) que estamos tentando minimizar - geralmente esse é o erro médio quadrático, ou seja, E[e(n)e(n)]. Tomando a derivada dessa quantidade wrtw não é tão simples.

A técnica comum é escrever a função objetivo em função de w e w - isto é, tratar w e wcomo variáveis ​​independentes. Agora temos

J(w)=F(w,w)

Para encontrar o mínimo, usamos os derivativos w e w e configurá-los para zero, então queremos resolver

F(w,w)w=F(w,w)w=0

No entanto, se você fizer a análise, verá que

F(w,w)w=0F(w,w)w=0

Para que você só precise resolver uma dessas equações.

Para detalhes completos, você pode consultar:

  • "Um operador complexo de gradiente e sua aplicação na teoria de arranjos adaptativos", Brandwood 1983, Communications, Radar e Processamento de Sinais, IEE Proceedings F
  • "O operador de gradiente complexo e o cálculo CR" Kreutz-Delgado aqui
  • "Gradiente complexo e Hessiano", van den Bos, 1994, Visão, processamento de imagens e sinais, procedimentos do IEE

Para a teoria dos filtros adaptativos, prefiro muito a apresentação em "Fundamentos da filtragem adaptativa", de Ali Sayed. Ele apresenta uma derivação unificada dos filtros LMS, NLMS, RLS, APA e Lattice.

David
fonte