Dither - Mas afinal, o que é e como usá-lo em minhas gravações? : Blog

Desde que quase todo o som reproduzido passou a ser digital, a teoria de audio teve que ampliar os conceitos de masterização. A produção musical hoje em dia envolve um bocado de tecnologia de informação. Você logo percebe isso quando vai exportar seus primeiros trabalhos. Escolher o melhor formato de audio passa por saber onde ele será reproduzido e sobretudo por conhecer como funciona o processo de conversão digital. O dither é um recurso providencial nesse caminho. É um ruído digital inserido no sinal de áudio para "camuflar" distorções no som provocadas por erros de quantização. O plug-in é usado na masterização, principalmente para baixar o bit depth de um arquivo. Mas para saber como aplicá-lo, é bom entender outros pontos presentes em todo o processo de gravação digital.

O que é?

O dither é um ruído adicionado ao sinal digital de áudio para ajustar a resolução no formato final exportado.

Para quê eu preciso ajustar a resolução da minha faixa?

Quando há um erro de quantização, que gera um ruído perceptível. Esse erro acontece em várias situações:

Quando convertemos o arquivo de áudio para um formato com menor bit depth, como de 24 bits para 16 bits;
a própria conversão analógico/digital em si já produz inevitáveis erros de quantização. Problemas na estrutura de ganho e na qualidade do sinal analógico também podem provocar o noise floor, ou ruído de fundo.

Convertendo o sinal

Quando você envia um sinal analógico para sua placa de som, ele é convertido em sinal digital. O som da sua voz captada pelo microfone, a guitarra, o teclado e tudo que entra via linha no conversor A/D (analog/digital) ou na interface (que normalmente possui esse componente) é transformado em sinal digital.

Sample rate

Para transformar a onda senoidal analógica em sinal digital, o conversor precisa condificar o sinal enviado em dados. Nesse processo, o conversor captura cada segundo do sinal que entra várias vezes por segundo. Quanto mais capturas por segundo, maior a taxa de sample rate, ou frequência de amostragem. Quanto maior o sample rate, maior a fidelidade digital na reprodução das frequências.

O teorema de Nyquist-Shannon - sob o qual se alicerça todo o áudio digital - afirma que, para se alcançar a melhor fidelidade digital, a sample rate deve ter, no mínimo, duas vezes o tamanho da frequência mais alta do áudio. Já que o ouvido humano suporta até 20 khz, o sample rate mais usado é 44,1kHz. Se você tentar digitalizar acima disso, é gerado um fenômeno chamado aliasing, que produz uma onda diferente, mais grave. A taxa de 44,1 kHz representa que cada segundo de som é capturado digitalmente 44.100 vezes. O 44,1kHz é usado no CD. Atualmente também são adotadas taxas de 48kHz ou mais. Você é quem define o tamanho da taxa, no seu DAW, quando vai exportar o áudio.

Bit depth

Depois de capturadas, as amostras são armazenadas em bits. O bit depth, ou profundidade de bits, é uma importante definição na qualidade do áudio. Cada bit representa 6 dB. A quantidade de bits define a faixa dinâmica, ou dynamic range, daquele arquivo. O dynamic range é o intervalo entre os maiores e menores valores de um sinal sonoro.

Se o áudio tem 16 bits-per-sample, a taxa suportada pelo CD, são 96dB de margem dinâmica. O padrão adotado pelo DVD e Blu-Ray, 24 bits, representa 144dB de dynamic range. É você, operando o DAW, que escolhe também o bit depth da faixa, claro, de acordo com o processador do seu computador e sua interface.

Com um dynamic range amplo, as frequências são mais bem distribuídas, o noise floor, ou ruído de fundo, menor e menos perceptível, resultando em um SNR (signal to noise ratio) mais alto.

Ou seja, o ruído gerado pela quantização é baixo em resoluções com altas taxas de bits-per-sample. Ao converter o seu arquivo de áudio para resoluções mais baixas, o ruído de fundo tende a aumentar. Com o ruído presente, é necessário aplicar o dithering. Mas, de onde exatamente surge esse ruído?

Erro de quantização

A masterização digital de alta qualidade é feita em 32 bits. Porém, precisamos exportar o arquivo em resoluções mais baixas para que ele seja reproduzido em outros dispositivos de áudio. Então, o downsampling sempre vai acontecer em algum momento da sua produção.

Reduzir profundidade de bits significa subtrair informação digital daquele som. Nesse processo, ocorre uma espécie de arredondamento: os valores que representavam as diferenças de amplitude na profundidade de bits anterior se realocam em valores mais próximos dos seus, no novo bit depth. Mas como não há espaço para todo mundo, acontece a truncagem, ou erro de quantização. O erro provoca um ruído periódico na reprodução, uma distorção harmônica, perceptível aos nossos ouvidos.

Erros de quantização também acontecem quando o sinal analógico enviado é fraco, distorcido ou apresenta alguma interferência. Um toque importante é gravar alto, pelo menos a partir de - 6dB. Fique de olho na estrutura de ganhos da sua captação - cabos, mesa, equalizador, direct box, mic, instrumentos - de forma a garantir um sinal limpo e claro para dentro do seu DAW.

O dither

O dither é um ruído branco, ou seja, aleatório e de igual intensidade em diferentes frequências. É inserido no bit menos significante (o LSB, Least Significant Bit) do sinal de áudio. Esse ruído é como uma vibração constante, semelhante ao zumbido quase imperceptível do carro em movimento. Como é randômico, ele leva aleatoriedade aos sinais mais baixos do sinal, mascarando o ruído periódico criado pelos erros de quantização.

Um bom teste para entender o que é esse ruído: tente abrir um projeto em branco no seu DAW e aplicar o dither. Você vai ouvir o ruído constante, parecido com o do aparelho de TV quando está fora do ar. Por mais estranho que pareça, a permanência do dither faz com que a distorção gerada pelos erros de quantização não seja percebida. Isso se dá devido a um fenômeno da psicoacústica, estudo que relaciona as sensações auditivas e as características físicas do som. Sabe quando você está em uma boate barulhenta mas sua atenção faz com que você entenda perfeitamente o que a pessoa do seu lado fala, em baixo volume? O efeito do dither parte da mesma relação cérebro/ouvido/som.

Outro teste interessante é: exporte uma faixa duas vezes, com as mesmas configurações, mas uma delas passando pelo dither, a outra sem o plug-in. Exporte um arquivo pouco maior do que o som, ou seja, com uns segundos sobrando após o som acabar. Ouça e compare esses segundos de cada faixa para entender o efeito do dither.

Conversão de 24 para 16 bits sem dither. Distorções a partir de 48 dB.

A mesma conversão com dither. Note a presença do ruído de fundo a partir de 72 dB.

Para quê aplicar o dither?

Em alguns vídeos, sites ou estúdios, você vai ouvir falar que, caso você esteja produzindo já em 16 bits e venha a exportar no mesmo bit depth, o dither é dispensável. Porém, os plugins, faders e busses aplicados na sua produção são calculados pelo DAW em uma resolução maior que os arquivos de áudio, então, os erros de quantização são sempre possíveis. A menos que você esteja trabalhando com 32 bits em ponto flutuante, é bom sempre usar o dither.

A inserção do ruído em sinais baixos "empurra" para cima o sinal original, reduzindo a faixa dinâmica. Em um arquivo de 16 bits-per-sample, o dither faz o dynamic range cair de 96 dB para cerca de 93 dB. Porém, ao mascarar a distorção gerada pelo erro de quantização, o dither melhora a relação sinal ruído.

Usar o dither deve ser a última coisa a se fazer antes de exportar o arquivo do seu DAW. Excesso de dither após dither torna o áudio um pouco velado. O ideal é que o ruído dele não seja perceptível. Se você ouvir o ruído que o dithering produz na faixa exportada, algo está errado.

Não use o dither:

Se você for mandar o arquivo para masterizar em outro DAW. Nesse caso é melhor exportar o arquivo em 32 bits, sem dither;
para alterar a profundidade de bits para maior - de 16 para 24 bits, por exemplo.

Tipos de dither

O dither é presente em vários plug-ins com outros efeitos (tome cuidado com isso). A maioria dos plug-ins de dither oferece o noise shaping, a modelagem de ruído. Esse recurso permite aplicar um equalizador ao dither, movendo o ruído para regiões do espectro de frequência fora da sensibilidade auditiva humana.

Os principais modelos de dither noise shapig são o triangular (citado como o mais seguro) e o retangular. Os tipos mais populares são o POW-R (Psychoacoustically Optimized Wordlength Reduction), SNS da Prism, UV22 da Apogee, Bitmapping da Sony e iZotope MBit + Dither, da WaveLab.

Apesar de aparecer no final do processo de masterização, a aplicação do dither envolve todo o caminho da produção. Agora que você já sabe do assunto, tire o melhor som do seu DAW.

Dither – Mas afinal, o que é e como usá-lo em minhas gravações?