Les ingénieurs du son ont souvent du mal avec les enregistrements altérés par le bruit de fond, mais une société allemande appelée AI-coustics tente de changer cela en utilisant l'IA générative d'une nouvelle manière pour améliorer la clarté de la parole dans les films.
AI-coustics a fait ses débuts avec un financement de 1,9 million d’euros, proposant une technologie qui va au-delà de la suppression traditionnelle du bruit. Selon Fabian Seipel, co-fondateur et PDG, leur technologie est conçue pour améliorer la qualité audio sur tous les appareils et haut-parleurs.
Leur objectif est de rendre toutes les interactions numériques aussi claires que les diffusions en studio, qu'il s'agisse d'une conférence téléphonique ou d'une vidéo sur les réseaux sociaux.
AI-coustics a été créée en 2021 à la suite du mécontentement mutuel de l'ingénieur du son Seipel et du professeur d'apprentissage automatique à l'Université technique de Berlin Corvin Jaedicke, concernant la mauvaise qualité audio du contenu éducatif en ligne. Les propres luttes de Seipel contre la perte auditive, dues à ses premiers travaux dans la production musicale, sont l'inspiration derrière sa mission personnelle visant à améliorer la clarté audio numérique.
AI-coustics se distingue dans le domaine très fréquenté des produits d'amélioration de la voix basés sur l'IA grâce à son approche créative du développement de technologies de réduction du bruit.
L'algorithme de l'entreprise, qui récompense les utilisateurs qui complètent leur ensemble de données de formation, est basé sur des échantillons de parole capturés dans leur studio berlinois. Ils utilisent ensuite cet ensemble de données pour améliorer leur IA de réduction du bruit, qui, au cours de son processus de formation, imite avec précision une variété de défauts audio.
Des inquiétudes existent cependant concernant l'approche de paiement unique des contributeurs et les éventuels biais de reconnaissance vocale. Afin de contrecarrer les préjugés, AI-coustics s'attache à diversifier sa base de contributeurs afin de garantir l'efficacité de la technologie dans tous les contextes linguistiques et démographiques.
Trois clips vidéo différents ont été diffusés via la plateforme AI-coustics pour évaluer l'efficacité de la technologie. Les résultats ont montré une amélioration significative de la clarté de la parole grâce à la réduction du bruit de fond.
AI-coustics espère utiliser sa technique pour l’augmentation de la parole préenregistrée et en temps réel. Il peut même intégrer sa technologie dans des biens de consommation pour améliorer automatiquement la qualité de la voix. Pour le moment, la startup propose un SDK, une application Web et une API pour faciliter le post-traitement audio et vidéo.
Grâce à une combinaison de flux de revenus à la demande, par abonnement et sous licence, AI-coustics a attiré à la fois une large base d'utilisateurs et des entreprises clientes. Grâce à son récent système de financement et de soutien, l'entreprise entend accroître ses effectifs et améliorer sa stratégie d'amélioration de la parole afin de répondre aux attentes du marché et de négocier avec l'écosystème du capital-risque.
En réponse aux craintes que l'intelligence artificielle (IA) ne remplace les travailleurs, Seipel souligne comment l'IA-coustics peut accélérer le processus de production audio, libérant ainsi les ingénieurs humains pour d'autres tâches tout en garantissant une sortie vocale de haute qualité. La technologie de la startup promet une large applicabilité sur tous les appareils et contenus, visant à résoudre le problème répandu de la mauvaise qualité audio dans la communication numérique.
Apprenez l'IA, l'apprentissage automatique et l'analyse de données chez Code Labs Academy et devenez un data scientist certifié en quelques mois seulement.