Estou procurando boas ferramentas para processamento de sinal de áudio. por exemplo, análise de fala e música, identificação automática de idiomas, etc.
A biblioteca Scipy fornece funções para processamento de áudio? Possui uma boa ferramenta para processamento de sinais de áudio?
Você pode sugerir uma ferramenta para isso?
audio
python
signal-detection
user1147663
fonte
fonte
Respostas:
Pessoalmente, acho o Python uma das melhores opções existentes e fiz alguns trabalhos na área de identificação de áudio. Você é convidado a verificar, por exemplo, o meu software para identificação automática de aves a partir de gravações de áudio ruidosas: Ornithokrites . O programa é usado pelo Departamento de Conservação da Nova Zelândia e eles estão felizes com isso. Com base neste exemplo, gostaria de destacar várias vantagens do uso do Python:
Minha segunda opção seria R. Embora não seja tão rico em recursos como o Python, ele possui um grande número de bibliotecas úteis (verifique, por exemplo, seewave para seus aplicativos). A instalação daqueles no Windows e no Linux é fácil, o que é importante se você desejar que outras pessoas usem seu programa. No entanto, para minha experiência, a computação de alto desempenho em R é mais difícil - uma coisa importante a ser observada se você precisar fazer MUITO processamento e identificação.
Exemplos de classificação musical em Python:
Sistemas de aprendizado de máquina de construção de livros com Python tem um capítulo sobre classificação musical
Outras ferramentas (lista de forma alguma completa): Python no Music
fonte
Parece que o Python é uma linguagem popular para isso, com alguns bons conjuntos de ferramentas baseados no fato de que ... Bem, eu o vi em uso em alguns departamentos e empresas de tecnologia da música.
Na academia, é muito comum ver esse tipo de trabalho feito no Matlab, pois reúne muitos kits de ferramentas poderosos (Processamento de Sinais, Computação Paralela, gráficos, utilitários de banco de dados, Machine Learning, AI) em um IDE fácil de analisar. No entanto, custa dinheiro e apresenta algumas desvantagens (não é a melhor linguagem de programação em termos de design e desempenho de aplicativos, por isso é principalmente uma ferramenta de prototipagem, mas pode compilar até C). O Octave é a alternativa gratuita, mas não posso garantir a qualidade das ferramentas de processamento de sinal ou do próprio software, pois não o usei.
fonte
scipy
ecossistema tem muitas funcionalidades do MATLAB.Você também pode verificar o pyAudioAnalysis : combina bibliotecas abertas para reconhecimento de padrões e várias implementações de recursos de áudio. Alguns exemplos de aplicativos implementados no pyAudioAnalysis , que você pode achar interessantes:
fonte
Você pode usar a biblioteca C ++ da análise de áudio Essentia , que inclui ligações python. Você aproveitará todas as vantagens do ambiente python / scipy, além de muitos algoritmos de análise de áudio / música que acompanham o Essentia.
fonte