Els enginyers d'àudio sovint lluiten amb les gravacions contaminades pel soroll de fons, però una empresa alemanya anomenada AI-coustics està intentant canviar-ho utilitzant IA generativa d'una manera nova per millorar la claredat de la parla a les pel·lícules.
AI-coustics va fer el seu debut amb un finançament d'1,9 milions d'euros, oferint una tecnologia que va més enllà de la supressió tradicional del soroll. Segons Fabian Seipel, cofundador i CEO, la seva tecnologia està feta per millorar la qualitat de l'àudio a tots els dispositius i altaveus.
El seu objectiu és fer que totes les interaccions digitals siguin tan clares com les emissions d'estudi, ja sigui una trucada de conferència o un vídeo de xarxes socials.
AI-coustics es va establir el 2021 com a resultat de la insatisfacció mútua de l'enginyer d'àudio Seipel i del professor d'aprenentatge automàtic de la Universitat Tècnica de Berlín Corvin Jaedicke, sobre la mala qualitat d'àudio del contingut educatiu en línia. Les pròpies lluites de Seipel amb la pèrdua auditiva dels seus primers treballs en la producció musical són la inspiració de la seva missió personal de millorar la claredat de l'àudio digital.
AI-coustics es distingeix en el camp concorregut dels productes de millora de la veu amb intel·ligència artificial amb el seu enfocament creatiu per al desenvolupament de la tecnologia de reducció del soroll.
L'algoritme de l'empresa, que recompensa els usuaris per afegir al seu conjunt de dades d'entrenament, es basa en mostres de parla que es van capturar al seu estudi de Berlín. A continuació, utilitzen aquest conjunt de dades per millorar la seva IA de reducció de soroll, que durant el seu procés d'entrenament imita amb precisió una varietat de defectes d'àudio.
Tanmateix, hi ha preocupacions pel que fa a l'enfocament de pagament únic dels col·laboradors i als possibles biaixos de reconeixement de veu. Per contrarestar els prejudicis, AI-coustics es dedica a diversificar la seva base de col·laboradors per tal de garantir l'eficàcia de la tecnologia en tots els contextos lingüístics i demogràfics.
Es van executar tres videoclips diferents mitjançant la plataforma d'AI-coustics per avaluar l'eficàcia de la tecnologia. Els resultats van mostrar una millora significativa en la claredat de la parla mitjançant la reducció del soroll de fons.
AI-coustics espera utilitzar la seva tècnica tant per a l'augment de la parla pregravada com en temps real. Fins i tot pot incorporar la seva tecnologia als béns de consum per augmentar automàticament la qualitat de la veu. De moment, l'inici proporciona un SDK, una aplicació web i una API per facilitar el postprocessament d'àudio i vídeo.
Amb una combinació de fluxos d'ingressos sota demanda, basats en subscripcions i llicències, AI-coustics ha atret una gran base d'usuaris i clients empresarials. Amb el seu recent sistema de finançament i suport, la companyia té la intenció de fer créixer la seva plantilla i millorar la seva estratègia de millora de la parla per tal de satisfer les expectatives del mercat i negociar l'ecosistema de capital risc.
En resposta a la preocupació que la intel·ligència artificial (IA) pugui substituir els treballadors, Seipel destaca com la acústica intel·lectual pot accelerar el procés de producció d'àudio, alliberant els enginyers humans per a altres tasques alhora que garanteix una sortida de veu d'alta qualitat. La tecnologia de la startup promet una àmplia aplicabilitat entre dispositius i contingut, amb l'objectiu de resoldre el problema generalitzat de la mala qualitat d'àudio en la comunicació digital.