Obrigado pela referência! Você esqueceu de mencionar seu trabalho sobre aprimoramento de bateria , o que também pode ser interessante para a aplicação de Summer_More_More_Tea. Bem, isso tudo realmente depende do que você quer fazer com isso. Você tem uma "aplicação final" específica em mente?
Concordo plenamente com as afirmações acima de pichenettes. Para ser completo, devo dizer que o aprimoramento vocal que você mencionou também foi usado em alguns trabalhos de Matti Ryynänen, na geração de faixas de karaokê, para aprimorar os resultados.
Para responder suas perguntas:
Dada a eficácia, qual é a preferida (ou qualquer outra solução :)?
Como as pichenettes disseram, nenhuma delas parece atender à sua necessidade: a filtragem passa-baixo / passa-alto provavelmente falhará devido à estrutura harmônica da voz humana (e mais geralmente a qualquer som "interessante" - ou seja, qualquer coisa além dos sinusóides ... )
Se o segundo, deixe dois canais A e B, serão usados (BA) ou (AB) ao calcular o fundo? Assim como na fusão de dois canais, a aritmética significa precisa o suficiente?
Novamente, o segundo método mencionado não serve, porque você pode remover apenas o sinal que está no centro e não recuperá-lo. Em outras palavras, mesmo os vocais estão no "centro", não há matemática simples para obter um sinal apenas dos vocais.
Ou posso reduzir a amostragem de cada canal por um fator de dois e intercalar os sinais de redução da amostragem como resultado mono?
er ... calcular a média dos canais para obter um sinal monocanal, como sugerido acima, faz sentido e não interromperá as características espectrais do seu sinal (supondo que o sinal estéreo não seja degenerado). Então você obtém um sinal mono no qual possui basicamente o mesmo conteúdo musical de antes.
Reduzir a amostragem corretamente de cada canal significa que você primeiro aplica um filtro passa-baixo (com frequência de corte de sampling_rate / 4 no seu caso) e, em seguida, pode colher com segurança a cada 2 amostras. Entretanto, não há muito a dizer sobre a intercalação dos canais assim reduzidos: na maioria dos casos gerais, isso está quebrando as características espectrais do seu sinal. Você provavelmente não quer isso.
De fato, a operação de filtragem passa-baixo seguida de definir 0 a cada 2 amostras e manter esses zeros no domínio de Fourier, para "espelhar" os componentes de baixa frequência que foram mantidos nos de alta frequência. Lembre-se de que você ensina lições de processamento de teoria de amostragem: multiplicar por uma sequência de impulsos (ou diracs) resulta em uma convolução com outra sequência de diracs no domínio Fourier, ou seja, nesse caso, o espectro de frequências do sinal é repetido (periodizado) ao longo do eixo da frequência, com um período igual à taxa de amostragem.
Normalmente, ao reduzir a amostragem, você remove os 0s (porque assume uma nova taxa de amostragem). Mas aqui, mantê-los resulta em componentes adicionais de alta frequência muito irritantes. A intercalação desses sinais não vai corrigir isso.
Bem, apesar de tudo, a resposta curta: não faça isso . :-)
Por fim, também posso sugerir que você use a GUI que desenvolvi para a conferência LVAICA 2012: existe um repositório Git para isso. Ainda estou depurando e melhorando, então os comentários são bem-vindos: D
Espero que ajude!