Um formador de feixe de banda estreita pode ser usado para separação de fala

7

Na minha tese de mestrado, estou tentando implementar um beamformer.

Eu já fiz a parte da soma de atraso há 1 ano. Foi-me dito:

na filtragem FIR podemos fazer

FFT -> anula o compartimento de frequência indesejado -> IFFT.

Podemos fazer o mesmo em formadores de feixe. Se conhecermos a interferência do DOA (como 0 no ângulo 25 e 1 em qualquer outro lugar entre -90 a 90), podemos ---> IFFT e usar os pesos nos elementos de separação.

O que quer que eu tentei não funcionou. Do que comecei a ler livros, surpreendentemente não consegui encontrar o método que meu orientador me contou. Em vez disso, descobri métodos como MVDR, LCMV. Agora, estou tentando usar o método matlab lcmvweights para obter pesos corretos para cada elemento e aplicar no meu formador de feixe de soma de atraso. Mesmo que eu consiga usar esse método, estou curioso para saber se os formadores de feixe de banda estreita podem ser usados em sinais complexos, como fala?

beamforming Kadir Erdem Demir
fonte

5

Se você estiver lidando com, digamos, 8 kHz para uma largura de banda de voz nominal de 4kHz, ou seja, 0 Hz - 4 kHz, o discurso é essencialmente um sinal de banda larga. Portanto, o beamforming de banda estreita não funcionará muito bem. Seu padrão de feixe será bom para a frequência específica de interesse - mas, quando você começar a se afastar dessa frequência, seus padrões de feixe se deteriorarão.

O que você está procurando é a formação de feixe de banda larga - que usa atrasos reais (ou mudanças de fase lineares através da frequência no domínio da frequência) em vez de apenas mudanças de fase.

Normalmente, as técnicas como LCMV e MVDR são desenvolvidas para sinais de banda estreita. Existem algumas maneiras de abordar o problema da banda larga:

Use uma linha de atraso aproveitada em cada canal. Se você tem $n$ canais e $m$ toques por canal, sua matriz de correlação é $mn$ x $mn$ . Portanto, os sistemas de equações ficam muito grandes.
Use um monte de formadores de feixe de banda estreita. Nesse caso, você teria $m$ formadores de feixe ( $m$ freqüências) cada um $n$ canais. Agora, cada formador de feixes tem um $n$ x $n$ matriz de correlação, mas você tem $m$ deles. Por isso, leva a uma redução na complexidade do caso anterior.
Você pode formar um conjunto de $b$ feixes convencionais (usando atraso de tempo em vez de apenas multiplicador de fase) e, em seguida, faça o processamento adaptativo nos feixes.

A melhor referência que consigo pensar é de Van Trees - Optimum Array Processing. Observe que algumas vezes você encontra pequenas diferenças na terminologia - alguns textos indicam o MVDR como usando a matriz de correlação de sinal, enquanto outros usam a matriz de correlação de sinal mais ruído - Apenas tome cuidado com o que você está vendo. Eu sei que Van Trees faz uma distinção entre os dois casos. A maioria dos outros textos não utiliza e apenas usa uma formulação e a denomina MVDR.

David
fonte

Preciso mergulhar nas coisas da matriz de correlação. Estou com falta de formação teórica, estou lendo, mas não consigo entender exatamente. O que você acha que posso usar diretamente a função lcmvweights no matlab? Do que usá-los diretamente no meu formador de feixe de soma de atraso que eu já implementei.

Kadir Erdem Demir

@KadirErdemDemir Se você estivesse usando a opção 2 (acima), sim, poderia usar os pesos lcmv. Eu não estou familiarizado com os lcmvweights do Matlab - a menos que ele lide com formação de feixe de banda larga, você não poderá usar as saídas em um verdadeiro formador de feixe de soma de atraso (opção 1) (ao contrário de uma implementação de mudança de fase)

David

5

O trabalho de Darren Ward, Rod Kennedy e Bob Williamson investigou como projetar filtros aplicados a um formador de feixe de atraso e soma que permitia a aquisição de sinal de banda larga.

Como você pode ver na figura 2, um formador de feixe de banda estreita não funciona bem, pois a frequência muda da frequência do projeto.

A escolha adequada de filtros nos caminhos do formador de feixe de atraso e soma permite que uma resposta da matriz menos dependente da frequência seja formada (figura 4 de seu artigo abaixo).

Um artigo posterior que fiz com Darren e Bob mostra que é possível ter um design invariável à frequência e posicionar um nulo exato em uma determinada direção (por exemplo, esse artigo tem 20 anos este ano).

Peter K.
fonte

Um formador de feixe de banda estreita pode ser usado para separação de fala

Respostas: