Entendendo os valores salvos no arquivo WAVE

7

Os valores que podemos encontrar em um arquivo wave, por exemplo

    0.0036
    0.0026
    0.0174
    0.0050
    0.0026
    0.0108
    0.0154
   -0.0114
   -0.0006
    0.0115

são - como eu assumo - valores relativos entre -1 e 1, o intervalo que você normalmente vê ao assistir uma forma de onda em algum programa de edição de áudio. Agora, como esses valores relativos são mapeados quando você reproduz um arquivo? Por exemplo, se houver um valor de 0,5, isso significa reprodução com a metade da sonoridade máxima possível? Existe algum tipo de valor de referência armazenado no arquivo WAVE ao qual os valores relativos se referem?

Outra coisa: no exemplo acima, existem 7 valores positivos seguidos por 2 valores negativos. Portanto, a membrana que vibra em um alto-falante para criar o som é pressionada por mais tempo em uma direção do que na outra direção, ou como alguém deve interpretar isso? Valores positivos são uma direção da vibração e negativos são vibrações em outra direção ou estou errado sobre isso?

Muito obrigado :-)

stefan.at.wpf
fonte

Respostas:

7

O que você vê são amostras no domínio do tempo que correspondem ao deslocamento de um alto-falante de alguma posição de repouso em função do tempo. Por exemplo, a primeira amostra corresponde à posição da membrana em , a próxima representa sua posição em e assim por diante, assumindo que haja segundos entre as amostras. Intervalos de amostragem comuns para áudio incluem segundos e segundos.t=0 0t=TTT=1 18000T=1 144100

Para transformar um fluxo de amostras em áudio real, um conversor digital para analógico (DAC) é usado primeiro para gerar uma tensão analógica variável no tempo que corresponde às amostras. Essa tensão analógica seria aplicada à entrada de um amplificador de potência que aciona o alto-falante. O alto-falante é projetado de tal maneira que a posição de sua membrana varia proporcionalmente à tensão de entrada do alto-falante. No final desta cadeia, você tem uma membrana de alto-falante que se move de acordo com as amostras de áudio originais, produzindo o áudio desejado através de suas vibrações.

Como você observou, os valores da amostra são normalizados para um intervalo de . O volume resultante do áudio pode ser afetado por muitos fatores não digitais, como o ganho do amplificador que aciona o alto-falante ou a faixa de tensão de saída do DAC. Os valores máximos da amostra correspondem apenas ao "deslocamento máximo da membrana que o hardware pode gerar". Portanto, não há como codificar o volume absoluto do áudio em um fluxo de amostras, daí o uso de um esquema de normalização.±1 1±1 1

Jason R
fonte
2

Quando você reproduz um arquivo de áudio, o dispositivo normalmente possui algum tipo de controle de volume. Portanto, 0,5 seria relativo a algum volume máximo permitido pela configuração atual desse controle de volume.

Além disso, o caminho das amostras para o alto-falante tem uma resposta de frequência (que provavelmente não será plana de CC para a luz) que modificará o deslocamento real do alto-falante dos valores das amostras de ondas em escala. Como a resposta de frequência da maioria dos sistemas de áudio não passa em CC, a resposta do alto-falante provavelmente removerá qualquer deslocamento de CC e equilibrará os deslocamentos físicos positivos e negativos reais por períodos de tempo suficientemente longos.

hotpaw2
fonte