SUMÁRIO / Matéria de capa

Do MP3 ao áudio imersivo

02/02/2024 - 17:02h

Atualizado em 27/03/2024 - 23:39h

Reportagem: Miguel Sá | Fotos: Eleonora Hamburg / Divulgação

Um dos personagens principais do excelente livro “How Music Got Free” escrito por Steven Witt, o Professor Karlheinz Brandenburg é provavelmente um dos cientistas mais amados e mais odiados pela indústria fonográfica mundial e seus consumidores. Co-inventor do codificador perceptual MP3, ele e sua equipe literalmente destruíram a velha ordem mundial de uma indústria acostumada a vender plástico a peso de ouro.

Com passagens por templos icônicos da tecnologia de áudio - como os Laboratórios Bell e o Instituto Fraunhofer - Karlheinz atualmente lidera a Brandemburg Labs (www.brandenburg-labs.com), empresa startup que busca criar ilusões auditivas perfeitas. Na última feira Consumer Electronics Show ele demonstrou um novo sistema de fone de ouvido com áudio imersivo 3D.

Alexandre Algranti - Professor Brandenburg, o senhor é um dos personagens principais de um excelente livro que trata de uma grande ruptura…

Professor Karlheinz Brandenburg - Cerca de 80% do que escreveram está correto…(risos)

AA - Quando caiu a ficha para o senhor que a tecnologia de áudio digital iria destruir o status quo da indústria fonográfica mundial? Destruição total…

PKB - Quando eu estava começando o meu trabalho na universidade. Eu lembro que era no final de 1994. Havia um empresário inglês querendo realizar vendas legais de música de catálogo pela internet. Quando ele teve contato com o nosso trabalho, me perguntou se eu sabia que eu iria destruir a indústria mundial da música. Lógico que dependendo como a indústria iria reagir poderia dar ruim…

AA - E como o senhor explica o total desdém pelo potencial de pirataria do CD, isto numa época onde a pirataria de software em discos floppy corria solta. Os executivos regiamente pagos não conseguiram somar um mais um do tipo “eu tenho um floppy e consigo copiar milhares perfeitamente e com o CD vai ser igual”? Para mim foi provavelmente um dos maiores erros de negócios na história do Capitalismo.

PKB - Do final da década de 1990 ao início da década de 2000 eu participei de diversos painéis e a minha conclusão foi de que eles não estavam querendo enxergar além do modelo de negócios estabelecido. O sucesso do CD inclusive trouxe vendas adicionais das mesmas gravações em vinil, o que foi muito bom para as grandes gravadoras. Além do mais eles pensaram que, como a distribuição de música não autorizada era ilegal, as pessoas não iriam fazê-lo, o que na verdade estava errado. As pessoas começaram a distribuir. Alguns poucos porém estavam com muito medo do que estava por vir, mas mesmo assim eles não tentaram obter a solução correta. Eles (as gravadoras) focaram em medidas judiciais contra quem julgavam estar fazendo coisas ilegais pensando que o problema iria acabar.

Se você se lembra, tudo começou com downloads diretos em universidades nos EUA. Depois a coisa evoluiu para a tecnologia “peer to peer” e decolou. Virou um jogo de gato e rato que observamos à distância. Nós nunca endossamos a distribuição ilegal de música. Mesmo recebendo royalties por nossas patentes, nunca pensamos que os músicos poderiam ter os seus direitos usurpados e não serem pagos pela música que estavam criando. Era uma questão das gravadoras desenvolverem tecnologias para distribuir música de forma legal e desta forma mudar o seu modelo de negócio. Mas por muito tempo elas não quiseram fazer.

AA - Armas não matam pessoas. Pessoas matam pessoas… Um codec MP3 é somente uma ferramenta. Não podemos culpá-lo pelo fim de uma era da indústria. Quando o senhor lançou a primeira versão do codificador, o senhor anteviu algo como o Napster de um lado e o iTunes do outro?

PKB – (Risos) Sim. É por isso que pensamos que ajudamos a criar algo mais para o iTunes do que para o Napster. Desde o início a nossa ideia era que o decodificador fosse grátis ou quase de graça, onde o codificador seria usado somente pelos profissionais e desta forma bem mais caro. Este modelo de negócios não funcionou para nós porque um dos nossos codificadores foi roubado e distribuído livremente. Nós chegamos a conversar com empresas como a Musicmatch, que na época tinha um sistema tipo “jukebox” onde os usuários poderiam, a um preço muito razoável, ter acesso a codificadores. Nós inclusive tentamos agregar uma tecnologia de encriptação, mas que só funcionaria se o conteúdo a incorporasse, mas as grandes gravadoras não quiseram utilizá-la. Fizemos uma demo para uma delas, mas no final fomos indagados o que tal tecnologia tinha haver com ela. Foi no final de 1994, mas eles realmente não entenderam…

AA - Qual bitrate resulta em uma pessoa normal a percepção igual a de quando se escuta um CD?

PKB - Fizemos muitos testes. Tenho que dizer que o MP3 enfrentou algumas dificuldades quanto à padronização, e ele não é perfeito. Alguns sinais, como por exemplo de castanholas, eu, na minha idade, conseguiria identificar se o áudio seria proveniente de um arquivo em MP3 ou de um CD em qualquer bitrate no padrão. Eu estive envolvido também com o formato AAC, adotado pela Apple em 256 kbits/s, e até hoje não consegui encontrar alguém com “golden ears” capaz de identificar as diferenças em um teste cego verdadeiro. É o mais próximo da perfeição que dá para chegar. O MP3 não é perfeito mas para ouvir no trem ou no avião eu me dou bem com o bitrate de 128 kbits/s. Eu sei que às vezes pode não soar tão bem, mas se eu tiver um bom codificador a taxa de 128 é suficiente para mim.

AA - Uma vez eu li que a gravadora Deutsche Grammophon adotou a taxa de 320 kbits/s, isto é um exagero?

PKB - É a maior taxa possível com o formato MP3, mas do jeito que o MP3 é implementado realmente não há diferença entre 256 e 320. Então neste sentido é um exagero. Com a taxa de 192 eu ainda consigo detectar diferenças com o CD. Mas com o codificador AAC temos mais qualidade na taxa de 128 do que com o MP3 a 192. Nós sabíamos que tínhamos um formato vencedor com o AAC.

AA - Numa era de banda e armazenamento fartos, faz sentido comprimir arquivos de áudio?

PKB – (Risos) Eu ouvi este argumento pela primeira vez em uma conferência científica no final da década de 1980. Este argumento sempre esteve presente, e sempre ele é verdadeiro para algumas aplicações nas quais você precisa de uma redução de 10 para 1 para fazer a diferença. Existem muitas aplicações. Se você tem um disco rígido com 10 TB em casa, você consegue armazenar mais música que você vai conseguir ouvir na sua vida. Se você quiser baixar arquivos para escutar localmente, com a banda larga você pode trabalhar com arquivos do tipo FLAC com codificação sem perdas, mas há aplicações onde a compressão faz a diferença.

AA - Qual é o estado da arte da tecnologia imersiva para fones de ouvido? Mas não me fale em remixar discos sagrados como o “Kind of Blue” do Miles Davis, isto para mim foi um sacrilégio…

PKB – (Risos)…

AA - Vai contra minhas crenças musicais…

PKB - O sonho sempre foi reproduzir a música com a sensação de ter os músicos presentes na sala. Todos os sistemas comerciais disponíveis atualmente não conseguem fazer isto. No que tange os alto falantes, tivemos grandes avanços há 30 anos atrás com a síntese de campo de onda (“wave field synthesis”) e agora temos sistemas que dão uma grande sensação imersiva se a sala for boa, o sistema estiver configurado corretamente e você tiver todos os dados, mas a tecnologia nunca atingiu uma grande escala junto aos consumidores.

Com relação aos fones de ouvido, muitos não consideram aspectos básicos de como o nosso cérebro funciona. Tudo conhecido por evidências anedóticas mas que recentemente chegaram aos livros texto. Ao ouvir, o nosso cérebro faz comparações com expectativas de como as coisas devem soar. Isto impacta como as pessoas obtêm a impressão sobre a qualidade do áudio. Como na discussão entre o vinil e o digital, (a diferença) é majoritariamente psicológico. Quando você ouve um disco tem aqueles pequenos efeitos colaterais causados pela agulha deslizando nos sulcos que afetam o som de uma certa forma. E se as pessoas gostam disto e esperam por isto elas vão preferir isto mais do que qualquer outra coisa. Não é uma diferença absoluta na qualidade do áudio. Soa mais próximo do que as pessoas esperam.

A Universidade de Huddersfield, na Inglaterra, realizou um experimento onde as pessoas escutaram um disco de vinil e o áudio proveniente de uma workstation para escolher qual soava melhor, e 60% das pessoas escolheram o vinil. Porém elas não sabiam que o disco tinha um time code gravado nos sulcos que sincronizava a mesma fonte sonora na workstation. As pessoas ouviram a mesma fonte mas ao olhar para o disco de vinil elas julgaram que o mesmo soava melhor. Isto claramente destaca a importância da psicologia no processo auditivo. Além de as pessoas estarem acostumadas com um tipo de reprodução musical, outro fator que foi esquecido é que o cérebro sempre escuta as diferenças sutis, tais como se estamos nos movendo em uma sala. A menos que haja uma reverberação excessiva, nós não notamos(as diferenças), mas isto tem uma importância em como nos sentimos imersos. Sistemas que levam isto em consideração foram desenvolvidos nos últimos 10 anos em diversas universidades. Eu creio que a minha empresa é ainda a única que propõe isto tudo para aplicações amplas. Realizamos demonstrações em vários locais e as pessoas concordam que este é um passo grande com relação ao que veio antes.

AA - E com relação a adoção da tecnologia de áudio imersivo para fones de ouvido entre os consumidores mais jovens? Eles estão buscando esta tecnologia?

PKB - É uma questão importante. Já tentaram disseminar a tecnologia de som surround por muitos anos. Foi adotada na indústria do cinema mas nunca foi realmente adotada massivamente no ambiente doméstico. Constatamos que os mais jovens buscam por fones e por experiências sonoras de alta qualidade. É por isto que eu estou otimista . Temos que tomar muito cuidado com as aplicações musicais, com nosso sistema de imersão para fones conseguimos até 16 canais. Recentemente, no Consumer Electronics Show, tivemos um set up com 16 alto falantes com o sistema Dolby Atmos onde eu realmente não gostei do resultado. Era só soprar som em todas as direções mas não era música de verdade. Eu creio que é um processo de aprendizado de como utilizar estas tecnologias que ainda tem que ocorrer. Me lembra dos primórdios do estéreo de dois canais, onde tínhamos o estéreo ping pong. As pessoas tem que tomar cuidado ao utilizar estas tecnologias. Quando eu escuto um par de fones de ouvido eu sinto o som dentro da minha cabeça, quando deveria ser similar a um bom sistema estéreo ou 5.1. Quando chegarmos nisso teremos o potencial de vender centenas de milhões de fones.

AA - O que é a realidade auditiva personalizada promovida pela sua empresa?

PKB - Isto surgiu em meu trabalho de pesquisa acadêmica faz alguns anos e a ideia é usar os fones para melhorar a sua audição em locais onde você poderia ter dificuldades - por exemplo, estou em um evento social com diversas pessoas ao redor e me sinto incomodado com o barulho, então eu posso ativar um cancelamento de ruído. Os mais jovens conseguem fazer isto, é o famoso efeito coquetel (“cocktail party effect”) que permite selecionar certas fontes sonoras mesmo na presença de outras fontes ao redor - e com isto conectar a novas tecnologias como telefones celulares, onde a pessoa com quem estou falando soa estar ao meu lado. Posso também combinar com tecnologias de tradução, o equivalente ao famoso Babel Fish do livro “Guia do Mochileiro das Galáxias”, e por aí vai. Seria um fone de ouvido com suporte universal que permite escutar o ambiente como se fosse uma realidade mas que pode melhorar a sua audição. Da mesma forma que os meus óculos realçam a minha visão, esta tecnologia realça a audição, não somente para os com deficiências auditivas mas para todos. Esta tecnologia também gera sinais de alerta. Você não ignoraria o carro que está prestes a te atropelar e nem o carro de bombeiros e por aí vai.

AA - Daria para conversar com um amigo durante um show, falaria ao telefone como se o show não estivesse rolando.

PKB - Esta é a ideia, mas tem algumas coisas ainda para serem resolvidas. Mas esta é a ideia geral.

AA - Esta tecnologia tem aplicações corporativas e industriais? Tipo um piloto recebendo um aviso que uma lâmina na turbina se despedaçou.

PKB - Isto pode ser feito e de fato já conversamos com algumas pessoas sobre isto. Se você se encontra em um ambiente de produção com muito ruído onde normalmente não é possível conversar, as pessoas utilizam protetores auditivos mas não conseguem ouvir os outros. Então podemos combinar proteção auditiva com comunicação. Dá para fazer uma reunião no local sobre o que a máquina está fazendo.

AA - Tecnologias como esta podem ser abordadas pelo lado dos consumidores de conteúdo e dos produtores. Quais dispositivos vestíveis o sr. visualiza além dos fones de ouvido?

PKB - Boa pergunta! Não acredito em dispositivos tipo óculos, você deve lembrar do Google Glass original, não sei se foi uma boa idéia.

AA - Dá para pensar em usar com fones que funcionam com condução óssea ou tem que ser com transdutores tradicionais?

PKB - A condução óssea facilita em alguns aspectos. Há muitos anos escutei um dos primeiros fones com esta tecnologia e fiquei impressionado, não pensava que poderiam soar tão bem, mas não dá para implementar o cancelamento de ruído.

AA - E quais ferramentas podemos esperar do lado dos criadores de conteúdo? Seria um hardware, um plug in?

PKB - O que fazemos está do lado da renderização então podemos combinar esta tecnologia com estéreo de dois canais, com o surround clássico com 5.1 canais, com as tecnologias Dolby Atmos, Sony 360 ou mesmo com os formatos usados na produção como o ADM que incorporam elementos sonoros mais metadados. Ter um sistema baseado em objetos realmente facilita o nosso trabalho.

AA - O renderizador já está disponível para beta testes? Aproveito para me voluntariar…

PKB – (Risos) Estamos trabalhando com alguns estúdios para demonstrar o nosso sistema. É a fase final que precisamos vencer para conseguir mais financiamento. Atualmente estamos trabalhando na Bélgica, Suíça, Berlin e com a New York University. Temos dez sistemas em demonstração. Um aspecto importante é uma tecnologia de rastreamento de cabeça (“headtracking”) rápida e precisa. Estamos usando um sistema VIVE da HTC. Nesta primeira geração, funciona bem a um custo razoável, porém não é para o mercado consumidor. Outro aspecto que estamos trabalhando é um sistema de medição de salas. Estamos trabalhando para simplificar isto, visando reduzir a possibilidade de erros no setup. Esta tecnologia é muito sensível a erros de medição e pode não soar bem… Temos que resolver esta questão para criar uma nova geração para profissionais como você.

AA - Trabalhei na Beyerdynamic quando a empresa lançou o sistema de fones de ouvido surround Headzone com duas versões, uma para profissionais e outra para consumidores. Era fantástico, talvez um produto além do seu tempo. Mas deu para sentir a questão do usuário comum ter que instalar o transmissor de head tracking no televisor e tal. Hoje o consumidor quer apertar um botão no aplicativo e só…

PKB - Com certeza. O que fazemos durante a nossa apresentação é utilizar um sistema surround convencional com caixas e o replicamos virtualmente, onde muitos profissionais nos indagam se as caixas foram mesmo desligadas. Quando eles retiram o fone de ouvido é só “wow”! Então estamos um passo à frente do que a Beyerdynamic conseguiu fazer naquele tempo.

AA - O que é uma ilusão auditiva perfeita e o quão longe estamos dela?

PKB - Se você limitar isto ao som dentro da sua sala, imagina um combo de jazz tocando nele: já conseguimos obter esta sensação usando fones de ouvido. Se quisermos criar a ilusão de uma sala muito maior, ainda funciona, porém com diferenças entre o real e o virtual. É fácil de distinguir. Mas estamos muito longe da ilusão auditiva perfeita.

AA - A diferença entre a sala menor e a maior estaria no processamento necessário? Já estamos na GPUlândia?

PKB - Não, não. E isto se dá por causa do nosso cérebro, que se lembra da sala na qual estamos. E se quisermos dizer ao nosso cérebro que estamos nesta igreja grande e o cérebro se lembra como é uma igreja grande, há cinco minutos eu estava numa sala pequena, e conclui que há algo errado e a solução não funciona mais.

AA - Quais cinco discos de vinil o sr. levaria para uma viagem a Marte? São nove meses de viagem.

PKB - Eu não levaria vinis, pesam muito pela quantidade insuficiente de música. Levaria o meu telefone ou um player. Meu gosto musical é muito diverso então levaria discos de folk rock, como a Enya, levaria uns clássicos, as “Quatro Estações” do Vivaldi, e pianistas. Há muitas alternativas. Talvez a coletânea “1” dos Beatles. E algum pop contemporâneo. Mas nada de ópera ou hard rock.

AA - E para fechar ?

PKB - Gostaria de dizer que a minha carreira se estendeu por muitas décadas e o fazer foi muito importante, não somente o ouvir. E trabalhei com um grande time, não trabalhei sozinho. Este trabalho não é só meu. Às vezes realizei a pesquisa básica, em outras somente gerenciei pessoas, mas sempre foi com grandes times. É importante que os jovens saibam da importância de trabalhar em equipe e também acreditar no que se está fazendo, você pode ficar famoso desta maneira.

COMPARTILHE

voltar

CATEGORIAS

ÚLTIMAS NOTÍCIAS

Luzes, texturas e misturas: best of Blues and Rock Festival

Cezar Galhart e a luz do Best of Blues and Rock Festival

Direitos autorais e Inteligência Artificial

Direitos autorais e Inteligência Artificial: as ferramentas que o autor já tem e as que pode vir a ter para se proteger

A História do Microfone Unidyne série 55

O Unidyne série 55 foi inspirado nas grades dos luxuosos carros da época.

COMENTÁRIOS

Nenhum cadastrado no momento

DEIXE SEU COMENTÁRIO

Escreva sua opinião abaixo*