Som e qualidade são algo como religião. História sem fim.
As pessoas dirão que MP3 320kbps é sem perdas, enquanto especialistas dizem que qualquer MP3 é uma porcaria, mas no final, ninguém ouvirá uma diferença no resultado ... a menos que estejam na indústria da música há mais de 20 anos.
Qual seria o melhor formato para videogame e quais propriedades deveriam ser suficientes (Hertz, taxa de bits etc.), assumindo que o MP3 de 320kbps é "pesado"?
Talvez um exemplo ou dois, como alguns títulos AAA funcionam com seus sons.
Respostas:
Atualização julho de 2017
Se você estiver usando o Unity ou outro mecanismo grande que possua um sistema de gerenciamento de ativos, não solicite Ogg Vorbis a seus designers e compositores de som. Obtenha WAVs ou AIFFs.
O Unity e o Unreal são estruturados para trabalhar com rejeições de alta qualidade e depois aplicar configurações de compactação por plataforma. Ter o recurso de origem como Ogg ou Mp3 significa que você está compactando duas vezes o áudio e introduzindo artefatos adicionais sem nenhum benefício.
Se você perceber que começar do ogg ou mp3 reduz o tamanho da sua compilação, esse não é um bom motivo. Provavelmente significa que você está pré-exportando com configurações de compactação diferentes das aplicadas no Unity / Unreal. Existem execuções? Sim, mas você não procuraria esta resposta se soubesse quando essas exceções eram aplicáveis.
Se você estiver pré-compactando para reduzir o tamanho do seu repositório, use o LFS, use um sistema centralizado de controle de versão ou sorria e aguarde.
TL; DR
A verdadeira resposta
O áudio codificado em MP3, independentemente da qualidade da codificação, é sempre com perdas. É um codec perceptivo e, portanto, funciona codificando propriedades do som ao longo do tempo em ~ 1152 pedaços de amostra em uma forma compactada, a partir da qual amostras não compactadas podem ser extrapoladas pelo decodificador. Seu objetivo não é recriar com precisão o áudio original, apenas fornecer um que seja "bom o suficiente".
No entanto, como você disse, 320kbps parece muito bom. Geralmente, é considerado bom ou melhor que a qualidade do CD. No entanto, ainda não é possível recriar perfeitamente as amostras originais de um WAV não compactado codificado como um MP3 de 320kbps.
Geralmente, o Ogg Vorbis é um formato melhor que o MP3. É geralmente aceito fornecer uma melhor qualidade para o mesmo tamanho de arquivo e, ao contrário do MP3, pode ser facilmente repetido facilmente. Os pedaços de 1152 amostras que o MP3 usa para codificar o áudio geralmente deixam o silêncio no início e no final de um som. Não é grande coisa para efeitos sonoros básicos, mas um grande problema para loops de música.
O Flash IDE contorna isso durante a exportação .swf, elimina o silêncio manualmente. As pessoas que usam áudio de fluxo contínuo (ou mxmlc puro) conseguem fazer loop através do SampleDataEvent e soltar amostras manualmente ou pré-processar o arquivo MP3 (consulte o blog de Andre Michelle e o utilitário ComploPhase mp3loop )
Além disso, o uso de um decodificador de MP3 exige tecnicamente que você adquira uma licença de patente para usar (já que a patente do MP3 é de propriedade da Technicolor, Fraunhofer e outras). Obviamente, muitas pessoas lançaram jogos freeware que usavam MP3, mas é melhor não mexer com isso.
Isso depende: Quais são suas plataformas de destino, quais outras tecnologias você está usando, como está distribuindo seu jogo e qual estilo você está adotando? Vou dividir isso em algumas categorias com base em plataforma, tecnologia e estética.
Títulos de PC e console de última geração
Os jogos AAA buscam qualidade de produção de primeira linha, por isso estão gravando e produzindo ativos sem compressão de 24 bits / 48 kHz (também o padrão para pós-produção de filmes). Títulos com ambições um pouco menores do que o Battlefield 3 podem gravar e produzir em 16 / 44.1, que é o padrão oficial para áudio com qualidade de CD.
Claro que você não pode enviar um monte de 24/48 WAVs não compactados com um jogo, seria muito grande. Então, finalmente, tem que haver algum tipo de compressão acontecendo. Geralmente, a regra geral é que, se for um efeito sonoro rápido como o de uma pistola (como a arma do Portal 2 fracassa na resposta de Sprunth), não há problema em deixá-la como WAV, possivelmente reduzindo a taxa de amostragem dependendo da frequência (consulte o Teorema de Nyquist , sons compostos de conteúdo de baixa frequência podem ser codificados em taxas de amostragem mais baixas). Para a música, não há realmente nenhuma maneira de contornar a compressão. Ogg Vorbis com qualidade de CD é o caminho a seguir (44,1kHz, qualidade 5-6 ou superior).
Além disso, os jogos AAA geralmente usam uma ferramenta intermediária para a compactação, uma ferramenta interna ou um middleware de áudio como FMOD ou Wwise. A maneira como funciona no FMOD e no Wwise é que você importa quase tudo como 16 / 44.1 ou 24/48 WAVs (ou, se o som tiver conteúdo de baixa frequência, ele pode ser importado com uma taxa de amostragem mais baixa) e forneça ao FMOD um fator de compactação para cada ativo, escolhendo uma codificação como ADPCM, MP3 ou Ogg Vorbis.
Na verdade, o FMOD recentemente abandonou o suporte para ativos de codificação nos bancos de som que você exporta do FMOD Designer (arquivos .fsb) como Ogg Vorbis em favor de um novo codec do Xiph chamado CELT . Ogg Vorbis pode ser um pouco difícil na CPU, então o CELT está sendo desenvolvido para fornecer uma alternativa. Você pode carregar os arquivos diretamente, mas não será mais usado para codificação no aplicativo Designer.
A propósito, aqui está um link interessante sobre o áudio da Battlefield Bad Company que também entra em cena um pouco. O DICE está na vanguarda da tecnologia de áudio em jogos, por isso é uma boa série de estudos.
Além disso, o surround está relacionado ao problema mono ou estéreo. Caso você não saiba, todos os seus efeitos sonoros devem ser mono, a menos que alguns deles façam uso de efeitos panorâmicos. O estéreo é estranho ao espacializar em um ambiente 3D, e você pode mover sons no código para colocá-los em um ambiente 2D.
Títulos pouco menos sofisticados, jogos independentes
Obviamente, isso pode variar bastante. Uma rápida olhada mostra que o Frozen Synapse usa arquivos Ogg Vorbis inteiramente, tanto para efeitos sonoros quanto para músicas. Dungeons of Dredmor, por outro lado, segue o esquema de Ogg Vorbis para música e 16 / 44.1 WAV para efeitos sonoros.
A abordagem Dungeons of Dredmor é preferível. Mesmo armazenados como WAVs não compactados, os efeitos sonoros geralmente são curtos o suficiente para não ocupar muito espaço, e você economiza muitos ciclos de CPU sem precisar decodificá-los. Você deseja carregar rapidamente um efeito sonoro na memória e reproduzi-lo. Se você codificar seus efeitos sonoros no Ogg Vorbis, é possível que haja um pequeno atraso antes que um jogador ouça seu efeito sonoro pela primeira vez.
Jogos de Navegador, HTML5 e Flash (com uma pitada de Mobile)
O áudio HTML5 está uma bagunça. Você deve fornecer as versões ogg e MP3 dos seus sons. Codifique com a mais alta qualidade possível, sem que o usuário fique furioso com o longo tempo de carregamento. Para MP3, não fique abaixo de 128k, é ruim o suficiente em 128.
O Flash aceita apenas MP3 de 16 bits / 44,1kHz, a menos que você enlouqueça e grave seu próprio decodificador para outro formato (como o decodificador experimental Ogg Vorbis nos laboratórios da Alchemy). No passado, o Flash tinha problemas com MP3s de taxa de bits variável, mas nunca tive um problema. A configuração de qualidade escolhida para o seu jogo em Flash dependerá do tamanho que você deseja que o seu .swf final tenha.
Atualização: Como o Tetrad mencionou , os jogos para celular precisam ser considerados com memória e armazenamento. A maneira como você codifica seu áudio para jogos para dispositivos móveis é muito parecida com o Flash. Você deseja manter a qualidade mais alta possível, mas, no final das contas, precisa ajustar um orçamento de memória e armazenamento. A música do rastreador é especialmente boa se você estiver com um orçamento apertado para armazenamento de música. Diga ao seu compositor limitar a sua paleta de amostra e você pode caber uma tonelada mais música no jogo.
Efeitos sonoros e música do tipo "8 bits" ou Chiptune
A maioria dos jogos apenas faz o que Frozen Synapse e Dungeons of Dredmor fazem. No entanto, você provavelmente pode reduzir a taxa de amostragem e a profundidade de bits. Não apenas pode se encaixar na estética que você está buscando, mas também pode economizar algum espaço.
Além disso, a música do rastreador geralmente armazena amostras em baixas taxas de amostragem, apenas permita que isso aconteça.
fonte
Como a indústria trabalha com o som, não tenho certeza.
Mas, olhando através dos meus jogos, a maioria deles envolve em algum arquivo dat ou de outra forma.
Aqui estão alguns bits de áudio que eu poderia obter:
Como não consegui descompactar nenhum arquivo dat, etc. (exceto o GCF do Portal 2), os resultados podem não mostrar o espectro no mercado. Tentei dar a você uma amostra de jogos, e esses que não empacotam o áudio parecem mostrar resultados semelhantes.
fonte
4000 Degrees Kelvin
é do primeiro Portal, não do segundo.Na minha experiência (principalmente títulos para celular), a qualidade do áudio deve ser a mais baixa possível, sem efeitos colaterais negativos, para que você tenha mais memória para outras coisas.
Lembre-se de que apenas porque há compressão envolvida, não significa necessariamente que sua qualidade é muito baixa. Seu público-alvo não fará comparações lado a lado com os sons base, como você está; portanto, se eles estiverem perdendo alguma coisa com a compactação com perdas, geralmente não saberão disso.
Por exemplo, você deve se perguntar se há algum motivo para usar sons ou músicas estéreo. O efeito que isso lhe dá vale quase o dobro da sobrecarga? Para música, dependendo de como é criada, a resposta pode ser sim. Alguns mecanismos nem suportam fontes estéreo para efeitos sonoros. Aquele tipo de coisa.
Onde essa linha está é muito subjetiva, é claro. Existem outras respostas que entram em regras mais específicas.
O importante é ter padrões, defini-los cedo e tentar cumpri-los. Se você estiver criando músicas para um jogo e tiver que metade da taxa de bits para caber na memória, ficará muito pior do que se definir um nível de baixa qualidade em primeiro lugar.
fonte
Se você estiver direcionando uma plataforma específica - iPhone, Xbox 360, PS3 -, verifique se o hardware possui um decodificador de áudio. Nesse caso, você deve usá-lo. Você economizará tempo de CPU (e vida útil da bateria!) Descarregando o áudio e poderá aproveitar ao máximo as APIs dessa plataforma. Mais importante, essa aceleração de hardware depende do áudio estar em um formato específico - portanto, sua escolha já será feita.
No entanto, se você estiver segmentando um PC, suas opções serão mais variadas. Eu apenas escolhia o formato com o menor tamanho de arquivo que ainda soa bem para seus ouvidos e o executava.
fonte
Depende do que "obscurecerá" a codificação com perdas - se você olhar para a resposta de Sprunth, a tendência geral da música é de alta qualidade para o menu e baixa qualidade para a música do jogo. O motivo é provavelmente porque:
Finalmente, outra tendência de suas respostas é que a maioria dos efeitos são 44KHz / 16bit; mas alguns jogos mais antigos permitiam rodar em 22KHz / 16bit ('Qualidade do som') - caso sua placa de som não aguentasse a taxa de amostragem mais alta.
fonte