Estou escrevendo a música para um videogame. Em algum momento, precisarei trabalhar com os programadores para determinar as especificações técnicas dos arquivos de áudio que vou entregar a eles. Sobre que tipos de detalhes precisamos falar?
Por exemplo, algumas perguntas que acho que precisamos resolver são:
- Em que formato os arquivos de áudio devem estar?
- Descomprimido? Sem perdas? Comprimido?
- Qual é o equilíbrio entre áudio de alta qualidade e tamanhos de arquivos pequenos?
- Quão alta deve ser a música?
- Qual deve ser o nível médio de volume de cada faixa?
- Qual deve ser o nível de volume mais alto?
- Qual deve ser a distribuição de frequência?
- Por exemplo, devo escrever uma música que não tenha muito baixo para que o foley mais baixo possa ser facilmente ouvido?
As perguntas que eu pensei sobre as mais importantes foram feitas? Existem outras perguntas que devemos discutir?
Respostas:
Se bem entendi, você tem duas perguntas diferentes aqui:
Que tipo de considerações técnicas (como na programação) devem ser estabelecidas?
Que tipo de considerações técnicas (como na engenharia de áudio) devem ser estabelecidas?
Para ambas as perguntas, sua melhor aposta é perguntar à pessoa responsável. No primeiro, poderia ser o programador principal de áudio, enquanto no segundo, o diretor de áudio.
Agora, suponho que, como você está perguntando isso aqui, você está em uma equipe pequena sem essas funções, e seu programador provavelmente não sabe do que está falando, então vou responder com algumas perguntas gerais. diretrizes que poderiam funcionar para a maioria dos projetos. Mas, de qualquer forma, eu não recomendaria tomar decisões por conta própria. Discuta com os outros membros da equipe para chegar a uma conclusão.
Dito isto, vamos falar primeiro sobre algumas considerações técnicas (de programação).
Geralmente, o formato no qual seus arquivos de áudio serão distribuídos já é determinado pela plataforma ou pelo mecanismo de jogo que você está usando. Se você for fazer várias plataformas, é provável que cada plataforma tenha diretórios de recursos completamente independentes, e as características dos arquivos de áudio podem ser diferentes para cada plataforma.
Por exemplo, pode ser necessário que você entregue arquivos Ogg Vorbis para Android, MP3 ou AAC para iOS e WMA para Windows.
Às vezes, até o formato depende da finalidade de cada arquivo. Enquanto o iOS reproduz bem arquivos MP3 e AAC para qualquer finalidade, o PlayStation Mobile requer MP3 para BGM, mas suporta apenas PCM descompactado ou Microsoft ADPCM.
Pergunte ao programador em que formato os arquivos devem estar.
Na maioria das vezes, as especificações básicas dos arquivos já estarão definidas, portanto, pergunte ao seu programador sobre isso. Por exemplo, os arquivos BGM geralmente são distribuídos em estéreo, enquanto os arquivos SFX e de voz são geralmente distribuídos em mono (para que possam ser facilmente posicionados dentro do jogo)
Para taxas de bits e outros parâmetros, mais uma vez, eles geralmente dependem do mecanismo ou da plataforma. Se você tem alguma liberdade aqui, considere que os dados sonoros geralmente são o maior componente de um jogo e, se o jogo for distribuído por downloads digitais, seu programador (e seus clientes) agradecerão se você tornar os arquivos tão pequenos que possível.
Se você distribuirá em mídia física, o tamanho máximo da distribuição é predeterminado e você terá que fazer algumas negociações sérias com o restante da equipe de criação de conteúdo.
Alguns jogos exigem que seus sons (principalmente BGM) sejam loopáveis; outros jogos exigem que seus sons tenham restrições estritas de tempo (como jogos de ritmo). A maioria dos esquemas de compressão com perdas adicionará um silêncio de preenchimento no início e no final da pista, o que pode interromper os loops e o tempo estrito. Discuta esses problemas com seu programador.
Existem muitas maneiras de compactar o áudio. Portanto, o que eu recomendo é a saída de uma versão principal de cada arquivo de som no PCM descompactado em 44.1KHz 16 bits Stereo e, em seguida, use esse arquivo para criar os arquivos reais para cada plataforma. (De maneira ideal, você pode criar um script de transformação que possa ser aplicado a cada arquivo, para não precisar reconvertê-lo cada vez que fizer uma pequena alteração no arquivo mestre).
Agora, em termos de considerações técnicas (como na engenharia de áudio), seu programador provavelmente não se importa, portanto, você terá mais liberdade nessa área. Há algumas coisas que você pode fazer para facilitar a vida do programador:
Todos os sons do jogo devem ter volume normalizado. No mínimo, todos os arquivos BGM devem ter o mesmo volume entre si e todos os arquivos SFX devem ter o mesmo volume entre si. Não faça com que o programador precise ajustar os volumes dentro do código.
O código de reprodução é muito limitado e geralmente só pode fazer amplificação linear. Por esse motivo, entre alto e baixo volume, pode-se preferir alto, pois reduzir o volume durante a reprodução geralmente leva a melhores resultados do que ampliá-lo. É difícil dizer qual deve ser a intensidade exata, mas, como regra geral, quanto maior a amplitude pico a pico, melhor você está usando a faixa de amostragem.
Você pode carregar outros jogos e reproduzir seus sons nas configurações de volume máximo e comparar seus sons com os deles.
Em termos de equalização, eu diria que isso realmente depende de quais outros sons o seu jogo terá. Além de discutir isso com o diretor de som, convém levar em consideração o hardware de reprodução que você usará: enquanto os computadores de mesa podem ter uma enorme variedade de hardware de reprodução, os dispositivos portáteis geralmente têm alto-falantes muito pequenos e você pode querer compensar isso. As máquinas de arcada também costumam ter requisitos muito diferentes.
fonte
Eu diferencio duas situações, o que eu mantenho por aí durante o desenvolvimento e depois (armazenamento) e o que coloco na entrega final.
Para armazenamento, eu uso a mais alta qualidade possível, ou seja, para áudio, algum formato sem perdas. Desde que a compactação seja sem perdas, isso realmente não importa; WAV ou FLAC serve. Basicamente, estou bem com uma gravação de 44,1 kHz / 16 bits e o volume deve ser o mais "natural" possível, portanto, basicamente, a gravação original com ganho mínimo, se necessário. (Se você realmente quiser, pode ir com gravações de 96 kHz ou 192 kHz.) O tamanho realmente não importa, os discos rígidos não são tão caros e você sempre pode jogar mais nesse problema. A lógica principal é que você sempre pode compactar em um formato com perdas a partir de um formato sem perdas, mas uma vez que você só possui arquivos com perdas, nunca poderá passar para uma qualidade superior.
Para entrega, é uma história totalmente diferente. Aqui você precisa fazer escolhas difíceis sobre qualidade x espaço x velocidade. Para SFX pequeno, eu uso arquivos WAV porque eles carregam o mais rápido. A música, por outro lado, importa, então eu normalmente uso MP3 com taxa de bits variável. Você pode se livrar de arquivos de 64 kbps, mas isso é uma questão de gosto. Os sons devem estar basicamente no volume natural, apesar de equilibrados. O mecanismo do jogo fará os ajustes necessários, especialmente se você estiver fazendo algo como som 3D.
fonte
sampling rate * sample size * channel count = bitrate
. É por isso que a taxa de bits do estéreo de 44,1 bits de 16 bits é exatamente 1411200 bits / s. 320kbps de som estéreo de 16 bits precisariam ser amostrados em 10KHz e, portanto, minha observação "soará horrível".