Alguém tem uma referência descrevendo o algoritmo MP3 de maneira passo a passo e clara para entender?
Essas referências eram um pouco confusas:
- Compactação de áudio usando transformada discreta modificada de cosseno, The MP3 Coding Standard , Joebert S. Jacaba, 2001
- A teoria por trás do Mp3 , Rassol Raissi, 2002
Estou disposto a codificar um fluxo de bits para MP3 depois de ler a referência que você introduz, manualmente, para uma compreensão completa do procedimento.
algorithms
reference-request
compression
mp3
Laurent Duval
fonte
fonte
Respostas:
Um padrão de compressão é uma coisa bastante delicada, que levou anos para se desenvolver e ajustar. Sugiro Análise do Algoritmo MPEG-1 Camada III (MP3) usando MATLAB , 2012 por Jayaraman J. Thiagarajan e Andreas Spanias. Após uma visão geral, ele leva você passo a passo pelos diferentes blocos de todo o esquema, fornecendo algum código Matlab para cada um deles.
fonte
Os artigos que você encontrou me parecem boas referências, eu os li brevemente e certamente desejarei estudá-los completamente, +1 por isso. Mas sua pergunta não parece fazer muito sentido, ou pelo menos não tem uma resposta viável.
O procedimento é extremamente complexo (como você leu os jornais) e é construído em várias camadas de cálculo básico, transformadas de Fourier, engenharia de áudio, processamento de sinais etc. Você não pode entender o procedimento sem entender o teoria.
Também não é humanamente possível, em termos práticos, codificar manualmente um arquivo de áudio manualmente. Você precisa fazer literalmente milhares (provavelmente centenas de milhares, para uma implementação completa em MP3) de operações aritméticas complexas apenas para codificar um único quadro de áudio de, por exemplo, 512 amostras. São apenas 0,01 segundos de música a uma taxa de amostragem de 44,1 KHz.
Talvez você deva direcionar seus esforços de aprendizado para coisas menos avançadas, para começar?
fonte