Atualmente, a transcrição de música polifônica não parece ser um problema resolvido.
Que tal o inverso de uma pequena parte do problema. Existe algum tipo de característica espectral (de um STFT) que possa ser usada para eliminar alguns acordes musicais do espaço de probabilidade? (por exemplo, esse trecho de som provavelmente não contém nenhum acorde C #, ou qualquer tipo de acorde menor diminuto, ou esta é uma nota única, não um acorde etc.)
Suponha que o trecho de áudio seja mais ou menos estacionário (ataque temporário removido etc.) e que conotações para a maioria ou todas as notas individuais estejam provavelmente presentes. (E esta pergunta não é sobre acordes invertidos.)
music
frequency-spectrum
hotpaw2
fonte
fonte
Respostas:
O problema da transcrição de músicas polifônicas tem recebido muita atenção da comunidade de pesquisadores nos últimos anos e eu diria que, para as polifonias para um único instrumento (piano, violão etc.), os resultados são muito bons. Aqui estão alguns artigos / autores que analisaram esse problema profundamente. Derry Fitzgerald fez muito na área, muito de seu trabalho na separação de fontes produz transcrições precisas. Anssi Klapuri analisou ainda mais especificamente o problema da detecção de acordes nas polifonias de múltiplos instrumentos. E, finalmente, embora não publicado, Mikel Gainza desenvolveu algoritmos de transcrição de acordes muito precisos para música comercial que serão lançados em breve em um produto de software baseado em guitarra, Riffstation.. As publicações nos links aqui devem fornecer uma boa idéia de como está atualmente o cenário da transcrição de músicas polifônicas.
fonte
Bem, para isso, o STFT conterá apenas um componente de frequência fundamental e outras frequências próximas dos harmônicos (mas não exatamente por causa da desarmonicidade ). Encontre os picos no espectro e veja se as frequências mais altas estão próximas dos múltiplos inteiros da menor frequência presente. Se houver frequências não harmônicas presentes, não será um tom único.
(Mas e os instrumentos que faltam em coisas fundamentais , ou fundamentalmente desarmônicas, como os sinos? Que tal dois instrumentos perfeitamente em sintonia tocando uma oitava à parte, de modo que as partes parciais se alinham principalmente entre si? Você deseja detectar isso como uma única nota ou duas notas?)
fonte