Estou procurando um software que permita a entrada de um arquivo de áudio (.wav .mp3 ...) e a saída do texto do arquivo de áudio.
Esse software existe? Encontrei apenas software que converte voz (ao vivo) em texto, mas não arquivos de áudio em texto.
software-rec
audio
speech-to-text
icu222much
fonte
fonte
Isso não responde à sua pergunta especificamente, mas o que eu faria na sua situação é distribuí-la como um trabalho do Amazon Mechanical Turk. Você provavelmente obterá os melhores resultados e pagará o mínimo de dólares dessa maneira.
fonte
O eMicrophones produz um produto comercial chamado Windows Speech Recognition Toolkit que agrega muitos benefícios ao Windows Speech Recognition, incluindo a capacidade de transcrever arquivos * .WAV (desde que sejam de você, ou seja, uma gravação como se você estivesse falando, não uma voz arbitrária) . Na lista de recursos:
fonte
Você pode adicionar o software VOICENOTE (gratuito) ao Google Voice. Isso converte conversa em texto. Em seguida, basta reproduzir a gravação de voz no seu alto-falante diretamente no microfone no VOICENOTE.
Pretendo usar o VOICENOTE para transcrever minhas anotações escritas em texto e salvar no MS Word. Então, quando eu salvo um documento, o Windows pode procurar minhas anotações manuscritas no computador. Caso contrário, as notas manuscritas podem ser salvas apenas como uma imagem. Somente os títulos podem ser pesquisados e você não consegue encontrar as palavras do documento para sua pesquisa.
fonte
Existe um projeto de software chamado 'fanscribe' que divide uma gravação e a divide em partes, distribuindo-as a pessoas interessadas que podem transcrever uma parte dela.
https://github.com/fanscrib/fanscrib/blob/master/README.rst
fonte