Converter fala (arquivos de áudio mp3) em texto

8

Estou à procura de um conversor simples de mp3 para txt. Tentei, sem sucesso: julius, CMU Sphinx, ... Nas últimas 4 horas, não encontrei uma maneira de usá-las (ou instalá-las adequadamente).

O que estou procurando é algo como:

$ converterapp -infile myspeech.mp3 -outfile myspeech.txt

Eu também estou bem com o aplicativo GUI, pois só tenho alguns arquivos para converter e posso clicar.

Edit: Com a ajuda desta resposta Aplicativo de reconhecimento de fala para converter MP3 em texto? Eu consegui fazê-lo funcionar, mas ele não produz saída. Bem, na verdade, produz algumas linhas em branco (nenhuma palavra detectada) ...

Samo
fonte
Qual é o comando exato que você executa e a saída que vê?
Nikolay Shmyrev 15/10
1
$ pocketsphinx_continuous -infile 1.wav -hmm pt-br / cmusphinx-pt-us-5.2 -lm pt-br / pt-70k-0.2.lm -logfn / dev / null &> otput.txt é o comando exato conforme @NikolayShmyrev question. Fiz o download dos modelos em sourceforge.net/projects/cmusphinx/files/… .
Samo

Respostas:

4

O pocketsphinx fará fala em texto a partir de um arquivo de áudio existente. Dependendo do formato inicial do mp3, você pode precisar de dois comandos separados.

Primeiro converta seu arquivo de áudio existente para o formato de entrada obrigatório:

    ffmpeg -i file.mp3 -ar 16000 -ac 1 file.wav

A corrida pocketsphinx

    pocketsphinx_continuous -infile file.wav 2> pocketsphinx.log > myspeech.txt

o arquivo criado myspeech.txt terá o que você está procurando.


Caso você seja novo no ubuntu, precisará instalar os programas acima usando este comando:

    sudo apt install pocketsphinx pocketsphinx-en-us ffmpeg
64pi0r
fonte