O que é taxa de amostragem e profundidade de bits? Eles importam?
Com serviços HiFi como Tidal, Qobuz e até Apple Music oferecendo áudio de profundidade de 24 bits com taxas de amostragem de até 192 kHz, o ouvinte médio pode estar se perguntando: o que isso significa e realmente importa? Queixas incessantes de nerds de áudio à parte, vamos detalhar o que são esses conceitos e o que os números estão nos dizendo. Se você é novo em tudo isso, tentarei o meu melhor para colocar tudo isso em linguagem e exemplos facilmente compreensíveis.
TAXA DE AMOSTRAGEM
O que é isso? Não quero ser sarcástico, mas é literalmente a taxa na qual o áudio é amostrado. Uma taxa de amostragem de 44,1 kHz significa que, para cada segundo de música, existem 44.100 pontos individuais nos quais as informações de frequência foram mapeadas. Esses pontos são reproduzidos em rápida sucessão ao longo de um segundo.
Vamos usar um exemplo relacionável para esclarecer isso: a taxa de amostragem é para o áudio o que a taxa de quadros é para o vídeo. Por exemplo, a maioria dos programas de TV tem de 24 a 30 quadros (imagens estáticas individuais) compondo 1 segundo de vídeo. Para transmissões esportivas, 60 quadros por segundo é comum. Como esses quadros são reproduzidos rapidamente, nossos cérebros interpretam o fenômeno como um movimento contínuo, e não como instâncias individuais.
Vamos executar o exemplo da imagem um pouco mais para ilustrar o próximo ponto sobre a taxa de amostragem. Quantos quadros por segundo (FPS) o olho humano vê? Parece haver duas respostas para esta pergunta: A) 60 FPS é o nosso limite superior ou B) algumas pessoas podem processar mais de 60 FPS. Portanto, para fins de simplicidade, digamos que o olho humano não pode discernir 60 FPS de 300 FPS como pode discernir 60 FPS de 10 FPS, e a maioria da comunidade científica provavelmente concordaria.
Se 60 quadros por segundo é o limite superior de nossa visão, quantas amostras por segundo servem como limite superior para nossos ouvidos? A resposta para isso seria 40.000 amostras por segundo (40 kHz) ou, para manter as coisas em termos de formatos de arquivo existentes, 44,1 kHz. Lembre-se disso, voltarei a isso em um momento - mas primeiro, vamos examinar brevemente o Teorema de Nyquist.
Teorema de Nyquist
Aqui temos um dos principais mandamentos do áudio: as ondas sonoras podem ser representadas com precisão e realismo, desde que as amostras possam ser obtidas com o dobro da velocidade da onda sonora de frequência mais alta.
Mais uma vez, vamos simplificar esse conceito, ou pelo menos esclarecer sua aplicação no mundo real: o limiar superior da audição humana é de 20 kHz – ou seja, ondas que se repetem 20.000 vezes por segundo. Por isso:
20 kHz (comprimento de onda mais curto/mais agudo dentro do alcance da audição humana)
x
2 ( amostras por comprimento de onda necessárias para reprodução de som precisa)
=
40.000 amostras por segundo (40 kHz) para reproduzir com precisão toda a gama de audição humana.
Isso, por algum motivo, tornou-se um ponto controverso em algumas comunidades de áudio. Taxas de amostragem mais altas, como 96 kHz e 192 kHz, são utilizadas para a gravação de música, devido a um efeito acústico conhecido como aliasing que acontece devido ao fenômeno nas frequências ultra-altas, que acaba afetando o áudio em uma faixa audível. Essa é uma lata de minhocas que não vou abrir aqui - meu ponto é que, quando se trata de simplesmente sentar para ouvir música, uma taxa de amostragem padrão de 44,1 kHz pode, em teoria, fornecer com precisão todas as frequências que seu cérebro e ouvidos podem processar.
PROFUNDIDADE DE BIT
A taxa de amostragem é responsável pela reprodução precisa da frequência. A profundidade de bits, por outro lado, é responsável pela reprodução precisa do volume. Em termos um pouco mais técnicos, nos referiremos a essa precisão de volume como Dynamic Range. A faixa dinâmica é a quantidade de espaço entre o som mais alto e o mais baixo em uma gravação. Por exemplo, o áudio de 16 bits tem 96 dB de faixa dinâmica, ou podemos dizer: o som mais alto absoluto em um arquivo será proporcionalmente 96 dB mais alto que o som mais baixo do mesmo arquivo. Todas as dinâmicas de volume podem ser imaginadas em uma escala de 0 a 96dB em gravação de 16 bits.
Sem surpresa, o áudio de 24 bits tem uma faixa dinâmica maior: o volume é dimensionado de 0 a 144 dB.
Vamos voltar a um paralelo visual para entender melhor isso. Se a taxa de amostragem é como quadros por segundo, qual é a profundidade de bits? Talvez possamos pensar nisso como resolução: 720p, 1080p, 4k, etc. Em vídeos e fotos, 1080p denota que 1080 pixels compõem a dimensão vertical de uma foto. A resolução de 1080p parecerá mais nítida e realista do que uma resolução de 720p, pois mais pixels estão sendo usados para representar um objeto, resultando em uma representação mais precisa de gradientes de cores e coisas dessa natureza.
Agora, em vez de gradientes de cores, pense em gradientes de volume para imaginar a profundidade de bits. O áudio com profundidade de 16 bits contém 65.536 etapas, enquanto o áudio com profundidade de 24 bits tem 16.777.215 etapas (não se preocupe com o que exatamente são as etapas, apenas pense nelas como uma subunidade de um bit). Isso dá ao áudio de 24 bits uma precisão muito maior quando se trata de representar com precisão taxas de volume delicadas (faixas dinâmicas) entre, por exemplo, o som de uma palheta tocando uma corda de violão e a nota C subsequente que soa, ou a faixa dinâmica entre essa mesma nota C fundamental e seus harmônicos mais altos.
Observei anteriormente que as limitações psicoacústicas humanas nos impedem de realmente ouvir uma diferença entre uma taxa de amostragem de 44,1 kHz e uma taxa de amostragem de 96 kHz. Pode não haver algo tão conciso quanto o Teorema de Nyquist quando se trata de quão perceptíveis são as diferenças na resolução de profundidade de bits, mas é um dilema que certamente merece consideração.
No geral
Então você pode desfrutar de música de alta qualidade em uma profundidade padrão de 16 bits e taxa de amostragem de 44,1 kHz? A resposta é decididamente sim. A resposta para saber se o áudio de 24 bits melhora ou não a qualidade está um pouco mais no ar do que se taxas de amostragem mais altas melhoram ou não a qualidade do áudio para fins de audição (provavelmente não). Não caia em pressões fabricadas para garantir que suas faixas favoritas tenham uma taxa de amostragem de 192 kHz e profundidade de 32 bits. Se você acha que pode ouvir a diferença ou acha que tudo soa exatamente igual, confie em seus ouvidos e volte a curtir sua música.
Curioso para incorporar esses conceitos em sua configuração de audição? Confira a extensa seleção de DACs e DAPs disponíveis na Audio46 .