Qual a qualidade dos meus sons?

33

Som e qualidade são algo como religião. História sem fim.

As pessoas dirão que MP3 320kbps é sem perdas, enquanto especialistas dizem que qualquer MP3 é uma porcaria, mas no final, ninguém ouvirá uma diferença no resultado ... a menos que estejam na indústria da música há mais de 20 anos.

Qual seria o melhor formato para videogame e quais propriedades deveriam ser suficientes (Hertz, taxa de bits etc.), assumindo que o MP3 de 320kbps é "pesado"?

Talvez um exemplo ou dois, como alguns títulos AAA funcionam com seus sons.

joltmode
fonte
3
Especialistas que ouvem a diferença entre MP3 de 320kbps e uma gravação sem perdas geralmente têm uma configuração de hi-fi (muito) cara que permite que eles ouçam essas diferenças. Não é algo que você possui no seu PC ou dispositivo móvel habitual. Também jogar um jogo é algo diferente de ouvir música. Há outras coisas que seu cérebro está ocupado com que pensar em qualidade de áudio sub-par;)
bummzack
2
@bummzack, sim, desde que a qualidade do áudio não seja tão ruim que seja perturbadora. Às vezes, encontro jogos com efeitos sonoros realmente ruins, com chiados de fundo ou compactados terrivelmente. No entanto, colocar quase qualquer consideração na qualidade do áudio provavelmente evitará isso. Eu sugiro que você teste suas amostras em algo com áudio mais sofisticado. Sua codificação de áudio não é o único fator que leva a um bom áudio.
user606723
A única razão pela qual sou contra o MP3 é porque ele faz um loop terrível.
Sidar

Respostas:

63

Atualização julho de 2017

Se você estiver usando o Unity ou outro mecanismo grande que possua um sistema de gerenciamento de ativos, não solicite Ogg Vorbis a seus designers e compositores de som. Obtenha WAVs ou AIFFs.

O Unity e o Unreal são estruturados para trabalhar com rejeições de alta qualidade e depois aplicar configurações de compactação por plataforma. Ter o recurso de origem como Ogg ou Mp3 significa que você está compactando duas vezes o áudio e introduzindo artefatos adicionais sem nenhum benefício.

Se você perceber que começar do ogg ou mp3 reduz o tamanho da sua compilação, esse não é um bom motivo. Provavelmente significa que você está pré-exportando com configurações de compactação diferentes das aplicadas no Unity / Unreal. Existem execuções? Sim, mas você não procuraria esta resposta se soubesse quando essas exceções eram aplicáveis.

Se você estiver pré-compactando para reduzir o tamanho do seu repositório, use o LFS, use um sistema centralizado de controle de versão ou sorria e aguarde.


TL; DR

  1. Sim , o MP3 320k parece ótimo. MAS . . .
  2. Não use MP3, use Ogg Vorbis em 44,1kHz, qualidade 6 para música. Para efeitos sonoros, use apenas 16 / 44.1 WAV, a menos que você realmente sinta que precisa cortar a gordura.
  3. Se você precisar usar MP3, como no Flash, tente usar 192k-256k (VBR 1 ou 2), mas talvez seja necessário aceitar 128k. Não vá abaixo de 128k (VBR 6).

A verdadeira resposta

As pessoas dirão que MP3 320kbps é sem perdas, enquanto especialistas dizem que qualquer MP3 é uma porcaria, mas no final, ninguém ouvirá uma diferença no resultado ... a menos que estejam na indústria da música há mais de 20 anos.

O áudio codificado em MP3, independentemente da qualidade da codificação, é sempre com perdas. É um codec perceptivo e, portanto, funciona codificando propriedades do som ao longo do tempo em ~ 1152 pedaços de amostra em uma forma compactada, a partir da qual amostras não compactadas podem ser extrapoladas pelo decodificador. Seu objetivo não é recriar com precisão o áudio original, apenas fornecer um que seja "bom o suficiente".

No entanto, como você disse, 320kbps parece muito bom. Geralmente, é considerado bom ou melhor que a qualidade do CD. No entanto, ainda não é possível recriar perfeitamente as amostras originais de um WAV não compactado codificado como um MP3 de 320kbps.

Geralmente, o Ogg Vorbis é um formato melhor que o MP3. É geralmente aceito fornecer uma melhor qualidade para o mesmo tamanho de arquivo e, ao contrário do MP3, pode ser facilmente repetido facilmente. Os pedaços de 1152 amostras que o MP3 usa para codificar o áudio geralmente deixam o silêncio no início e no final de um som. Não é grande coisa para efeitos sonoros básicos, mas um grande problema para loops de música.

O Flash IDE contorna isso durante a exportação .swf, elimina o silêncio manualmente. As pessoas que usam áudio de fluxo contínuo (ou mxmlc puro) conseguem fazer loop através do SampleDataEvent e soltar amostras manualmente ou pré-processar o arquivo MP3 (consulte o blog de Andre Michelle e o utilitário ComploPhase mp3loop )

Além disso, o uso de um decodificador de MP3 exige tecnicamente que você adquira uma licença de patente para usar (já que a patente do MP3 é de propriedade da Technicolor, Fraunhofer e outras). Obviamente, muitas pessoas lançaram jogos freeware que usavam MP3, mas é melhor não mexer com isso.

Qual seria o melhor formato para videogame e quais propriedades deveriam ser suficientes (Hertz, taxa de bits etc.), assumindo que o MP3 de 320kbps é "pesado"?

Talvez um exemplo ou dois, como alguns títulos AAA funcionam com seus sons.

Isso depende: Quais são suas plataformas de destino, quais outras tecnologias você está usando, como está distribuindo seu jogo e qual estilo você está adotando? Vou dividir isso em algumas categorias com base em plataforma, tecnologia e estética.

Títulos de PC e console de última geração

Os jogos AAA buscam qualidade de produção de primeira linha, por isso estão gravando e produzindo ativos sem compressão de 24 bits / 48 kHz (também o padrão para pós-produção de filmes). Títulos com ambições um pouco menores do que o Battlefield 3 podem gravar e produzir em 16 / 44.1, que é o padrão oficial para áudio com qualidade de CD.

Claro que você não pode enviar um monte de 24/48 WAVs não compactados com um jogo, seria muito grande. Então, finalmente, tem que haver algum tipo de compressão acontecendo. Geralmente, a regra geral é que, se for um efeito sonoro rápido como o de uma pistola (como a arma do Portal 2 fracassa na resposta de Sprunth), não há problema em deixá-la como WAV, possivelmente reduzindo a taxa de amostragem dependendo da frequência (consulte o Teorema de Nyquist , sons compostos de conteúdo de baixa frequência podem ser codificados em taxas de amostragem mais baixas). Para a música, não há realmente nenhuma maneira de contornar a compressão. Ogg Vorbis com qualidade de CD é o caminho a seguir (44,1kHz, qualidade 5-6 ou superior).

Além disso, os jogos AAA geralmente usam uma ferramenta intermediária para a compactação, uma ferramenta interna ou um middleware de áudio como FMOD ou Wwise. A maneira como funciona no FMOD e no Wwise é que você importa quase tudo como 16 / 44.1 ou 24/48 WAVs (ou, se o som tiver conteúdo de baixa frequência, ele pode ser importado com uma taxa de amostragem mais baixa) e forneça ao FMOD um fator de compactação para cada ativo, escolhendo uma codificação como ADPCM, MP3 ou Ogg Vorbis.

Na verdade, o FMOD recentemente abandonou o suporte para ativos de codificação nos bancos de som que você exporta do FMOD Designer (arquivos .fsb) como Ogg Vorbis em favor de um novo codec do Xiph chamado CELT . Ogg Vorbis pode ser um pouco difícil na CPU, então o CELT está sendo desenvolvido para fornecer uma alternativa. Você pode carregar os arquivos diretamente, mas não será mais usado para codificação no aplicativo Designer.

A propósito, aqui está um link interessante sobre o áudio da Battlefield Bad Company que também entra em cena um pouco. O DICE está na vanguarda da tecnologia de áudio em jogos, por isso é uma boa série de estudos.

Além disso, o surround está relacionado ao problema mono ou estéreo. Caso você não saiba, todos os seus efeitos sonoros devem ser mono, a menos que alguns deles façam uso de efeitos panorâmicos. O estéreo é estranho ao espacializar em um ambiente 3D, e você pode mover sons no código para colocá-los em um ambiente 2D.

Títulos pouco menos sofisticados, jogos independentes

Obviamente, isso pode variar bastante. Uma rápida olhada mostra que o Frozen Synapse usa arquivos Ogg Vorbis inteiramente, tanto para efeitos sonoros quanto para músicas. Dungeons of Dredmor, por outro lado, segue o esquema de Ogg Vorbis para música e 16 / 44.1 WAV para efeitos sonoros.

A abordagem Dungeons of Dredmor é preferível. Mesmo armazenados como WAVs não compactados, os efeitos sonoros geralmente são curtos o suficiente para não ocupar muito espaço, e você economiza muitos ciclos de CPU sem precisar decodificá-los. Você deseja carregar rapidamente um efeito sonoro na memória e reproduzi-lo. Se você codificar seus efeitos sonoros no Ogg Vorbis, é possível que haja um pequeno atraso antes que um jogador ouça seu efeito sonoro pela primeira vez.

Jogos de Navegador, HTML5 e Flash (com uma pitada de Mobile)

O áudio HTML5 está uma bagunça. Você deve fornecer as versões ogg e MP3 dos seus sons. Codifique com a mais alta qualidade possível, sem que o usuário fique furioso com o longo tempo de carregamento. Para MP3, não fique abaixo de 128k, é ruim o suficiente em 128.

O Flash aceita apenas MP3 de 16 bits / 44,1kHz, a menos que você enlouqueça e grave seu próprio decodificador para outro formato (como o decodificador experimental Ogg Vorbis nos laboratórios da Alchemy). No passado, o Flash tinha problemas com MP3s de taxa de bits variável, mas nunca tive um problema. A configuração de qualidade escolhida para o seu jogo em Flash dependerá do tamanho que você deseja que o seu .swf final tenha.

Atualização: Como o Tetrad mencionou , os jogos para celular precisam ser considerados com memória e armazenamento. A maneira como você codifica seu áudio para jogos para dispositivos móveis é muito parecida com o Flash. Você deseja manter a qualidade mais alta possível, mas, no final das contas, precisa ajustar um orçamento de memória e armazenamento. A música do rastreador é especialmente boa se você estiver com um orçamento apertado para armazenamento de música. Diga ao seu compositor limitar a sua paleta de amostra e você pode caber uma tonelada mais música no jogo.

Efeitos sonoros e música do tipo "8 bits" ou Chiptune

A maioria dos jogos apenas faz o que Frozen Synapse e Dungeons of Dredmor fazem. No entanto, você provavelmente pode reduzir a taxa de amostragem e a profundidade de bits. Não apenas pode se encaixar na estética que você está buscando, mas também pode economizar algum espaço.

Além disso, a música do rastreador geralmente armazena amostras em baixas taxas de amostragem, apenas permita que isso aconteça.

michael.bartnett
fonte
Efeitos sonoros explicados. Período.
precisa saber é o seguinte
1
Você tem um link para a alegação de que o FMOD está abandonando o suporte ao Ogg Vorbis?
Kylotan
1
Devo esclarecer, eles não abandonaram todo o suporte ao Ogg Vorbis. Ele não está mais disponível ao escolher um codec para ativos no FMOD Designer (resposta atualizada para refletir isso). Eles não fizeram grandes anúncios sobre isso, descobri quando fui tentar codificar algumas músicas em um banco de sons como Ogg Vorbis. O post da KVR menciona: kvraudio.com/news/… Mas você pode facilmente baixar o FMOD Designer e ver por si mesmo.
Michael.bartnett
1
@emddudley Se o áudio de sua fonte for algo do tipo 48bit / 196kHz, é possível compactá-lo de maneira a reter a quantidade insana de informações de frequência e amplitude e, portanto, ter maior fidelidade do que o áudio do CD, fixado em 16 bits / 44,1kHz.
michael.bartnett
1
O @DavidDimalanta WAV geralmente é muito maior que o MP3, mas com a vantagem de não precisar decodificá-lo, basta colocá-lo na memória. A música de fundo geralmente é compactada por esse motivo, à medida que o áudio armazenado aumenta, o tamanho aumenta rapidamente. O MP3 tem problemas com o licenciamento e o loop contínuo, como mencionei no asnwer, portanto, evite-o se puder.
Michael.bartnett
14

Como a indústria trabalha com o som, não tenho certeza.

Mas, olhando através dos meus jogos, a maioria deles envolve em algum arquivo dat ou de outra forma.

Aqui estão alguns bits de áudio que eu poderia obter:

  • Deus Ex: Revolução Humana (Menu Principal [música]) mp3 44100Hz 320kb / s
  • Portal 2 (4000 graus Kelvin [música]) mp3 44100Hz 128kb / s
  • Portal 2 (efervescente do Portal Gun [soundfx]) wav 44100Hz 16bits / amostra
  • Facções de risco ("NORMALLOOP_SEGMENT03" [soundfx]) ogg 48000Hz 128kb / s
  • Chamada de Juarez encadernado em sangue ("COJ2_Attack_16" [música]) ogg 48000Hz 350kb / s
  • Driver Zombie ("pickup_money" [soundfx], "main_menu" [song]) ogg 44100Hz 128kb / s
  • Conflito terrestre X3 ("00025" [música]) mp3 22050Hz 56kb / s
  • Bejeweled 3 ("Costeira" [ambiente]) ogg 44100Hz 96kb / s

Como não consegui descompactar nenhum arquivo dat, etc. (exceto o GCF do Portal 2), os resultados podem não mostrar o espectro no mercado. Tentei dar a você uma amostra de jogos, e esses que não empacotam o áudio parecem mostrar resultados semelhantes.

Sprunth
fonte
4000 Degrees Kelviné do primeiro Portal, não do segundo.
val diz Reintegrar Monica 29/11
6

Na minha experiência (principalmente títulos para celular), a qualidade do áudio deve ser a mais baixa possível, sem efeitos colaterais negativos, para que você tenha mais memória para outras coisas.

Lembre-se de que apenas porque há compressão envolvida, não significa necessariamente que sua qualidade é muito baixa. Seu público-alvo não fará comparações lado a lado com os sons base, como você está; portanto, se eles estiverem perdendo alguma coisa com a compactação com perdas, geralmente não saberão disso.

Por exemplo, você deve se perguntar se há algum motivo para usar sons ou músicas estéreo. O efeito que isso lhe dá vale quase o dobro da sobrecarga? Para música, dependendo de como é criada, a resposta pode ser sim. Alguns mecanismos nem suportam fontes estéreo para efeitos sonoros. Aquele tipo de coisa.

Onde essa linha está é muito subjetiva, é claro. Existem outras respostas que entram em regras mais específicas.

O importante é ter padrões, defini-los cedo e tentar cumpri-los. Se você estiver criando músicas para um jogo e tiver que metade da taxa de bits para caber na memória, ficará muito pior do que se definir um nível de baixa qualidade em primeiro lugar.

Tetrad
fonte
4

Se você estiver direcionando uma plataforma específica - iPhone, Xbox 360, PS3 -, verifique se o hardware possui um decodificador de áudio. Nesse caso, você deve usá-lo. Você economizará tempo de CPU (e vida útil da bateria!) Descarregando o áudio e poderá aproveitar ao máximo as APIs dessa plataforma. Mais importante, essa aceleração de hardware depende do áudio estar em um formato específico - portanto, sua escolha já será feita.

No entanto, se você estiver segmentando um PC, suas opções serão mais variadas. Eu apenas escolhia o formato com o menor tamanho de arquivo que ainda soa bem para seus ouvidos e o executava.

Blair Holloway
fonte
Você pode ser um pouco mais específico sobre os diferentes consoles?
Quazi Irfan
A idéia principal é direcionar aos PCs sim, diferentes sistemas operacionais. * NIX (incluindo Mac), Windows. Mas mais tarde expandirá para iOS, Android. Consoles de lado por enquanto.
precisa saber é o seguinte
4

Depende do que "obscurecerá" a codificação com perdas - se você olhar para a resposta de Sprunth, a tendência geral da música é de alta qualidade para o menu e baixa qualidade para a música do jogo. O motivo é provavelmente porque:

  • Nos menus, o único som que está tocando é a música - e, portanto, está "em foco"; você notaria as taxas de bits mais baixas com perdas.
  • No jogo, você tem os efeitos sonoros (explosões etc.), além da música sendo reproduzida em volume mais baixo; o que significa que você não notaria a perda de qualidade.
  • A ligação dos desenvolvedores de Juarez parece gostar de exagero.

Finalmente, outra tendência de suas respostas é que a maioria dos efeitos são 44KHz / 16bit; mas alguns jogos mais antigos permitiam rodar em 22KHz / 16bit ('Qualidade do som') - caso sua placa de som não aguentasse a taxa de amostragem mais alta.

Jonathan Dickinson
fonte