Os engenheiros de áudio muitas vezes lutam com gravações contaminadas por ruído de fundo, mas uma empresa alemã chamada AI-coustics está tentando mudar isso usando IA generativa de uma maneira inovadora para melhorar a clareza da fala em filmes.
A AI-coustics estreou-se com um financiamento de 1,9 milhões de euros, oferecendo uma tecnologia que vai além da tradicional supressão de ruído. Segundo Fabian Seipel, cofundador e CEO, sua tecnologia é feita para melhorar a qualidade do áudio em todos os dispositivos e alto-falantes.
Seu objetivo é tornar todas as interações digitais tão claras quanto as transmissões de estúdio, seja uma teleconferência ou um vídeo nas redes sociais.
A AI-coustics foi criada em 2021 como resultado da insatisfação mútua do engenheiro de áudio Seipel e do professor de aprendizado de máquina da Universidade Técnica de Berlim, Corvin Jaedicke, sobre a baixa qualidade de áudio do conteúdo educacional on-line. As próprias lutas de Seipel com a perda auditiva em seus primeiros trabalhos na produção musical são a inspiração por trás de sua missão pessoal de melhorar a clareza do áudio digital.
A AI-coustics se destaca no concorrido campo de produtos de melhoria de voz habilitados para IA com sua abordagem criativa para o desenvolvimento de tecnologia de redução de ruído.
O algoritmo da empresa, que recompensa os usuários por adicionarem dados ao seu conjunto de dados de treinamento, é baseado em amostras de fala capturadas em seu estúdio em Berlim. Eles então usam esse conjunto de dados para melhorar sua IA de redução de ruído, que durante seu processo de treinamento imita com precisão uma variedade de falhas de áudio.
Existem preocupações, no entanto, em relação à abordagem de pagamento único dos contribuintes e a possíveis distorções no reconhecimento de fala. Para contrariar preconceitos, a AI-coustics está empenhada em diversificar a sua base de contribuidores, a fim de garantir a eficácia da tecnologia em todos os contextos linguísticos e demográficos.
Três videoclipes diferentes foram executados na plataforma AI-coustics para avaliar a eficácia da tecnologia. Os resultados mostraram uma melhoria significativa na clareza da fala, diminuindo o ruído de fundo.
A AI-coustics espera usar sua técnica para aumento de fala pré-gravada e em tempo real. Poderá até incorporar a sua tecnologia em bens de consumo para aumentar automaticamente a qualidade da voz. No momento, a startup fornece um SDK, aplicativo web e API para facilitar o pós-processamento de áudio e vídeo.
Com uma combinação de fluxos de receita sob demanda, baseados em assinaturas e licenças, a AI-coustics atraiu uma grande base de usuários e clientes corporativos. Utilizando o seu recente sistema de financiamento e apoio, a empresa pretende aumentar a sua força de trabalho e melhorar a sua estratégia de melhoria da fala, a fim de satisfazer as expectativas do mercado e negociar o ecossistema de capital de risco.
Em resposta às preocupações de que a inteligência artificial (IA) possa substituir os trabalhadores, Seipel enfatiza como a AI-coustics pode agilizar o processo de produção de áudio, libertando os engenheiros humanos para outras tarefas e, ao mesmo tempo, garantindo uma saída de voz de alta qualidade. A tecnologia da startup promete ampla aplicabilidade em dispositivos e conteúdos, visando resolver o problema generalizado de má qualidade de áudio na comunicação digital.
Aprenda IA, aprendizado de máquina e análise de dados em Code Labs Academy e torne-se um cientista de dados certificado em apenas alguns meses.