O que é, o áudio imersivo? É possível dizer que formatos anteriores, como o Fantasound (experiência da Disney nos anos 40) e Dolby Surround são formatos imersivos?
Quando você mixa em formatos Surround como LCRS, 5.1 ou 7.1 você trabalha com posicionamento linear de áudio. Ou seja; centro, esquerda, direita, meio esquerda, meio direita, traseiro esquerda e direita, além do canal de graves que é omnidirecional. Quando você trabalha com sistemas imersivos você está trabalhando com caixas posicionadas acima e abaixo da linha auditiva e passa a se relacionar com seus canais de áudio por um conceito de objetos sonoros e isso será incorporado por programas como Atmos, Auro 3D e MPEG-H como metadados de posicionamento que poderão, mais tarde, serem incorporados em experiências binaurais através de headphones sem a necessidade de decodificação. Como a Academia assumiu todos os formatos surround como formatos imersivos, de forma prática e objetiva e considerando que a verdadeira imersão considere o posicionamento de objetos sonoros em planos outros que não os diretamente apontados para o ouvido do espectador, propostas como a da Dolby, com o Atmos, da Fraunhoffer com o MPEG-H e da DTS com o Auro 3-D são consistentes e não apenas curiosidades. Acredito que estas são propostas de experiências realmente imersivas e que amplificam a sensação sensorial de ambiência e participação de seus espectadores e, no caso do Atmos, evoluir para este formato a partir de algo como; Fantasound, LCR, LCRS (Pro Logic), 5.1 ou 7.1 é absolutamente factível.
No meu entendimento sobre imersão auditiva, quando um engenheiro de áudio mixa uma música em estéreo, a primeira decisão que ele tem que tomar é a de se ele mixará como espectador ou parte da banda. No áudio imersivo a decisão dele será em que espaço ele gostaria de ouvir sua obra (música, cinema, game, podcast). É interessante pensar que no universo audiófilo a busca é exatamente pela retratação da realidade, buscando criar sensações psico-acústicas, que vão além dos graves e agudos ou da esquerda e direita e passamos a nos preocupar com subjetividades, como; profundidade, palco, tamanho, ar, espaço entre instrumentos. Agora, com o a chegada do universo imersivo, trataremos com parâmetros como altura vertical do objeto, posicionamento destes objetos no panorama frontal, traseiro, lateral bem como em cada milímetro de ambiente e espaçamento entre os objetos que comporão nossas mixagens.
Desde quando se fala em áudio imersivo?
Se você quiser ser didático a respeito e considerar surround como áudio imersivo as experiências da Disney com Fantasound, datam dos anos 40. Mas falando de experiência própria, em 1982 eu tive acesso a uma quantidade de demonstrações em áudio binaural, o qual pra mim, é a proposta mais orgânica de imersão auditiva que há até hoje, mas sua experiência depende do uso de fones. Até o surgimento do Dolby Atmos, a binauralidade não previa mixagem, mas apenas o registro sonoro através do uso de microfones, quer fossem Ambisonic ou cabeças binaurais. Hoje este processo está acessível através do microfone ambisonic da ZOOM ou do binaural 3DIO. Já em 2006 eu participei de uma prova de conceito durante uma AES onde se propunham 22.2 canais em uma idéia de imersão que nos envolveria em um ambiente com caixas superiores e inferiores à linha auditiva. Era o nascimento do AURO 3D. Eu me lembro da cara do CODEC e esse sistema, usado na época, deu origem à ideia de imersão com caixas acústicas. Sistemas hoje utilizados pela Dolby e MPEG-H, que, apesar de competidores, me parecem que tiveram origem deste mesmo conceito de manipulação de áudio imersivo.
Quando a prática do conceito começou a se tornar uma realidade? É possível fazer um histórico?
Acho que uma informação dessas seria mais precisa se pesquisada no Wikipedia, mas comecei a ver interesse pela questão há umas 6 NAB (Feira da National Association of Broadcasters) atrás, quando AR, VR e XR passaram a fazer parte corriqueira do vocabulário audiovisual. Programas de “Head tracking” que permitiam a você conectar um sensor aos seus headphones de mixagem e fazerem este áudio acompanhar os movimentos da sua cabeça estavam sendo demonstrados em uma área selecionada especialmente para experiências imersivas. Todavia, no ano seguinte, essa área contava com apenas alguns “players” e não mais atraia a atenção das pessoas. Quando a ideia de áudio imersivo chegou aos aparelhos domésticos, em 2016, eu acho que a coisa tomou outro rumo e hoje você tem aplicativos de música como o Tidal disponibilizando mixagens de musica em Atmos
Seu estúdio trabalha com mixagens para cinema também. Qual a diferença do áudio em 3D para o estéreo? Qual a diferença de formatos como 5.1 ou 7.1 e ferramentas como o Dolby Atmos?
Os estúdios da Visom contam com uma sala de cinema equipada e certificada pela Dolby para mixagens em até 7.1. Assim que a pandemia der uma trégua, pretendo transformá-la em uma sala 9.1.6 Atmos de mixagem para cinema e passar a entregar nossas mixagens neste formato. Além disso, tenho a intenção de converter duas outras salas nossas em salas de mixagem 7.1.4 Atmos para mixagem de TV e Games. Quando você fala em áudio 3D para mim eu entendo como um áudio estéreo e não um áudio imersivo, pois há muito tempo nossos estúdios trabalham com o conceito de atenção total à qualidade, se apoiando em qualidade de eletricidade, cabos de força e de transmissão de altíssima fidelidade, conectores diferenciados e um trânsito de sinal que imprime uma tridimensionalidade ao áudio traduzível por um excelente par de caixas e amplificadores apenas. Todavia, se partirmos para mixagens surround ou mixagens 360 graus, onde consideraremos, além da linearidade acústica os posicionamentos superiores e inferiores de objetos de áudio, daí estaremos nos referindo a esta imersão sonora.
Tem diferenças em se gravar para mixar em estéreo, 5.1 ou 3D? Tem diferenças de equipamento?
Para gravar não há mudança nos equipamentos, mas na filosofia de ambientação onde você poderá prever o posicionamento imersivo de um determinado objeto e posicionar microfones para que a percepção espacial daquele objeto seja mais precisa em sua proposta de imersão.
E para mixar? É necessário uma sala especial, equipamentos de monitoração específicos? Você teve – ou vai ter que - preparar seu estúdio para as novas ferramentas? Ou não há tanta diferença?
Já para mixagem você tem que se munir de, no mínimo, 12 caixas acústicas e de sistemas de controle de monitoração bem mais complexos e precisos. Um controlador de monitoração como o Merging ANUBIS ou HAPI se tornam obrigatórios para isso. Nós já estamos equipados para montar duas salas 7.1.4 e uma sala 9.1.6 para o nosso sistema de mixagem de cinema. As 3 salas da Visom que foram desenhadas pelo engenheiro acústico americano George Augspurger foram desenhadas como salas Surround e se adaptam, em suas acústicas, com perfeição para a monitoração de sistemas imersivos.
E como é feita a reprodução para o ouvinte final? Como fica a qualidade de som para o ouvinte final nessa era de streaming e audio imersivo? Isso vai deixar de ser uma questão? A internet da casa das pessoas, os celulares, vão suportar isso? Como é a adaptação dessa coisa que sempre exigiu muito equipamento e espaços grandes aos fones e celulares?
Com o princípio de objetos sonoros para criar espacialização o sistema Atmos, da Dolby, oferece a proposta mais interessante e inteligente do mercado, cem por cento focada na experiência do consumidor, a Dolby permite que você utilize o sistema Atmos para traduzir uma experiência imersiva se utilizando apenas de headphones e de uma filosofia secular, que é a binauralidade. Outra questão interessante que proporcionará a rápida expansão da tecnologia são os soundbars e o “Echo Studio”, da Amazon, que vem com Alexa e Blue Tooth, permitindo que você conecte seu smartphone com um aplicativo como Amazon Music ou Tidal, que proporcionem musicas mixadas em Atmos para serem decodificadas e reproduzidas de forma imersiva pelo aparelho a partir de uma única fonte de áudio se utilizando de uma tecnologia chamada “Waveguide”.
A qualidade das gravações que serão mixadas em formatos imersivos não se altera. A experiência do ouvinte, por outro lado, é expandida. Todavia, devemos nos preocupar em nunca tirarmos a atenção do ouvinte/espectador da música, do game ou do filme com “brincadeiras sonoras”. Existem uma quantidade dessas “brincadeiras” no YouTube com os nomes de áudio 3D, 8D, 24D e outras palhaçadas. Mas se vocês quiserem ouvir uma experiência binaural imersiva relevante digitem no YouTube “virtual barber shop” e usem headphones para ouvir esse exercício interessantíssimo de binauralidade que tem mais de 25 anos de produzido e que é feito apenas com um sistema Ambisonics.