Audio-ingenieurs worstelen vaak met opnames die besmet zijn met achtergrondgeluid, maar een Duits bedrijf genaamd AI-coustics probeert dit te veranderen door generatieve AI op een nieuwe manier te gebruiken om de spraakhelderheid in films te verbeteren.
AI-coustics maakte zijn debuut met een financiering van € 1,9 miljoen en biedt een technologie die verder gaat dan traditionele ruisonderdrukking. Volgens Fabian Seipel, medeoprichter en CEO, is hun technologie gemaakt om de audiokwaliteit op alle apparaten en luidsprekers te verbeteren.
Hun doel is om alle digitale interacties net zo duidelijk te maken als studio-uitzendingen, of het nu een telefonische vergadering of een video op sociale media is.
AI-coustics werd in 2021 opgericht als resultaat van de wederzijdse ontevredenheid van audio-ingenieur Seipel en docent machine learning aan de Technische Universiteit van Berlijn, Corvin Jaedicke, over de slechte audiokwaliteit van online educatieve inhoud. Seipels eigen worstelingen met gehoorverlies uit zijn vroege werk in de muziekproductie vormen de inspiratie achter zijn persoonlijke missie om de helderheid van digitale audio te verbeteren.
AI-coustics onderscheidt zich in het drukke veld van AI-gestuurde stemverbeteringsproducten met zijn creatieve benadering van de ontwikkeling van ruisonderdrukkingstechnologie.
Het algoritme van het bedrijf, dat gebruikers beloont voor het toevoegen aan hun trainingsdataset, is gebaseerd op spraakvoorbeelden die zijn vastgelegd in hun studio in Berlijn. Vervolgens gebruiken ze deze dataset om hun AI voor ruisonderdrukking te verbeteren, die tijdens het trainingsproces nauwkeurig een verscheidenheid aan audiofouten nabootst.
Er bestaan echter zorgen over de eenmalige betalingsaanpak van de bijdragers en mogelijke vooroordelen over spraakherkenning. Om vooroordelen tegen te gaan, streeft AI-coustics ernaar haar bijdragersbestand te diversifiëren om de doeltreffendheid van de technologie in alle taalkundige contexten en demografische contexten te garanderen.
Via het AI-coustics-platform werden drie verschillende videoclips vertoond om de effectiviteit van de technologie te evalueren. De resultaten toonden een significante verbetering van de spraakhelderheid aan door het achtergrondgeluid te verminderen.
AI-coustics hoopt hun techniek te gebruiken voor zowel vooraf opgenomen als realtime spraakvergroting. Het kan zijn technologie zelfs in consumptiegoederen integreren om de stemkwaliteit automatisch te verbeteren. Momenteel levert de startup een SDK, webapplicatie en API om de nabewerking van audio en video eenvoudiger te maken.
Met een combinatie van on-demand, op abonnementen gebaseerde en licentie-inkomstenstromen heeft AI-coustics zowel een groot gebruikersbestand als zakelijke klanten aangetrokken. Met behulp van het recente financierings- en ondersteuningssysteem wil het bedrijf zijn personeelsbestand laten groeien en zijn strategie voor spraakverbetering verbeteren om aan de marktverwachtingen te voldoen en te onderhandelen over het durfkapitaalecosysteem.
Als reactie op de zorgen dat kunstmatige intelligentie (AI) werknemers zou kunnen vervangen, benadrukt Seipel hoe AI-koestiek het audioproductieproces kan versnellen, waardoor menselijke ingenieurs vrijkomen voor andere taken en tegelijkertijd spraakuitvoer van hoge kwaliteit wordt gegarandeerd. De technologie van de startup belooft een brede toepasbaarheid op verschillende apparaten en inhoud, met als doel het wijdverbreide probleem van slechte audiokwaliteit in digitale communicatie op te lossen.
Leer AI, machine learning en data-analyse bij Code Labs Academy en word in slechts enkele maanden een gecertificeerde datawetenschapper.