Los ingenieros de audio a menudo luchan con grabaciones contaminadas por ruido de fondo, pero una empresa alemana llamada AI-coustics está tratando de cambiar esto mediante el uso de IA generativa de una manera novedosa para mejorar la claridad del habla en las películas.
AI-coustics hizo su debut con una financiación de 1,9 millones de euros y ofrece una tecnología que va más allá de la supresión de ruido tradicional. Según Fabian Seipel, cofundador y director ejecutivo, su tecnología está diseñada para mejorar la calidad del audio en todos los dispositivos y altavoces.
Su objetivo es hacer que todas las interacciones digitales sean tan claras como las transmisiones de estudio, ya sea una conferencia telefónica o un video en las redes sociales.
AI-coustics se creó en 2021 como resultado de la insatisfacción mutua entre el ingeniero de audio Seipel y el profesor de aprendizaje automático de la Universidad Técnica de Berlín Corvin Jaedicke, por la mala calidad del audio del contenido educativo en línea. Las propias luchas de Seipel con la pérdida auditiva desde sus primeros trabajos en la producción musical son la inspiración detrás de su misión personal de mejorar la claridad del audio digital.
AI-coustics se distingue en el abarrotado campo de los productos de mejora de voz habilitados por AI con su enfoque creativo para el desarrollo de tecnología de reducción de ruido.
El algoritmo de la empresa, que recompensa a los usuarios por ampliar su conjunto de datos de entrenamiento, se basa en muestras de voz capturadas en su estudio de Berlín. Luego utilizan este conjunto de datos para mejorar su IA de reducción de ruido, que durante su proceso de entrenamiento imita con precisión una variedad de fallas de audio.
Sin embargo, existen preocupaciones con respecto al enfoque de pago único de los contribuyentes y posibles sesgos en el reconocimiento de voz. Para contrarrestar los prejuicios, AI-coustics se dedica a diversificar su base de contribuyentes para garantizar la eficacia de la tecnología en todos los contextos lingüísticos y demográficos.
Se ejecutaron tres videoclips diferentes a través de la plataforma AI-coustics para evaluar la eficacia de la tecnología. Los resultados mostraron una mejora significativa en la claridad del habla al reducir el ruido de fondo.
AI-coustics espera utilizar su técnica para el aumento del habla tanto pregrabada como en tiempo real. Incluso podría incorporar su tecnología a bienes de consumo para mejorar automáticamente la calidad de la voz. Por el momento, la startup proporciona un SDK, una aplicación web y una API para facilitar el posprocesamiento de audio y vídeo.
Con una combinación de flujos de ingresos bajo demanda, basados en suscripción y licencias, AI-coutics ha atraído tanto una gran base de usuarios como clientes empresariales. Utilizando su reciente sistema de financiación y apoyo, la empresa tiene la intención de aumentar su fuerza laboral y mejorar su estrategia de mejora del habla para cumplir con las expectativas del mercado y negociar el ecosistema de capital de riesgo.
En respuesta a las preocupaciones de que la inteligencia artificial (IA) pueda reemplazar a los trabajadores, Seipel enfatiza cómo la acústica de IA puede acelerar el proceso de producción de audio, liberando a los ingenieros humanos para otras tareas y garantizando al mismo tiempo una salida de voz de alta calidad. La tecnología de la startup promete una amplia aplicabilidad en todos los dispositivos y contenidos, con el objetivo de resolver el problema generalizado de la mala calidad del audio en las comunicaciones digitales.
Aprende IA, aprendizaje automático y análisis de datos en Code Labs Academy y conviértete en un científico de datos certificado en solo unos meses.