Inginerii audio se luptă adesea cu înregistrările afectate de zgomotul de fundal, dar o firmă germană numită AI-coustics încearcă să schimbe acest lucru utilizând AI generativă într-un mod nou pentru a îmbunătăți claritatea vorbirii în filme.
AI-coustics și-a făcut debutul cu o finanțare de 1,9 milioane EUR, oferind o tehnologie care depășește suprimarea tradițională a zgomotului. Potrivit lui Fabian Seipel, co-fondator și CEO, tehnologia lor este făcută pentru a îmbunătăți calitatea audio pe toate dispozitivele și difuzoarele.
Scopul lor este de a face toate interacțiunile digitale la fel de clare ca transmisiunile de studio, fie că este vorba de un apel conferință sau de un videoclip pe rețelele sociale.
AI-coustics a fost înființată în 2021, ca urmare a nemulțumirii reciproce a inginerului audio Seipel și a lectorului de învățare automată la Universitatea Tehnică din Berlin Corvin Jaedicke, cu privire la calitatea audio slabă a conținutului educațional online. Luptele proprii ale lui Seipel cu pierderea auzului din munca sa timpurie în producția muzicală sunt inspirația din spatele misiunii sale personale de a îmbunătăți claritatea audio digitală.
AI-coustics se remarcă în domeniul aglomerat al produselor de îmbunătățire a vocii activate de AI prin abordarea sa creativă a dezvoltării tehnologiei de reducere a zgomotului.
Algoritmul companiei, care recompensează utilizatorii pentru adăugarea la setul de date de antrenament, se bazează pe mostre de vorbire care au fost capturate în studioul lor din Berlin. Apoi folosesc acest set de date pentru a-și îmbunătăți AI de reducere a zgomotului, care în timpul procesului de antrenament imită cu acuratețe o varietate de defecte audio.
Există totuși îngrijorări cu privire la abordarea contribuitorilor cu plata unică și posibilele părtiniri de recunoaștere a vorbirii. Pentru a contracara prejudecățile, AI-coustics se dedică diversificării bazei de contributori pentru a garanta eficacitatea tehnologiei în toate contextele lingvistice și demografice.
Trei clipuri video diferite au fost rulate prin intermediul platformei AI-coustics pentru a evalua eficacitatea tehnologiei. Rezultatele au arătat o îmbunătățire semnificativă a clarității vorbirii prin reducerea zgomotului de fundal.
AI-coustics speră să-și folosească tehnica atât pentru creșterea vorbirii preînregistrate, cât și în timp real. Poate chiar să încorporeze tehnologia sa în bunurile de larg consum pentru a crește automat calitatea vocii. În acest moment, startup-ul oferă un SDK, o aplicație web și un API pentru a ușura post-procesarea audio și video.
Cu o combinație de fluxuri de venituri la cerere, bazate pe abonament și licențe, AI-coustics a atras atât o bază mare de utilizatori, cât și clienți de întreprindere. Folosind recentul său sistem de finanțare și suport, compania intenționează să-și dezvolte forța de muncă și să-și îmbunătățească strategia de îmbunătățire a vorbirii pentru a răspunde așteptărilor pieței și a negocia ecosistemul de capital de risc.
Ca răspuns la îngrijorările că inteligența artificială (AI) ar putea înlocui lucrătorii, Seipel subliniază modul în care AI-coustics poate accelera procesul de producție audio, eliberând inginerii umani pentru alte sarcini, garantând în același timp o ieșire vocală de înaltă calitate. Tehnologia startup-ului promite o aplicabilitate largă pe dispozitive și conținut, urmărind să rezolve problema răspândită a calității audio slabe în comunicarea digitală.
Învățați AI, învățarea automată și analiza datelor la Code Labs Academy și deveniți certified data scientist în doar câteva luni.