AI-coustics: startuolis, siekiantis tobulos skaitmeninio garso kokybės naudojant generatyvųjį AI

Atnaujinta November 19, 2024 2 Perskaityta minučių

Garso inžinieriai dažnai susiduria su foninio triukšmo užterštais įrašais, tačiau Vokietijos įmonė, vadinama AI-coustics, bando tai pakeisti, naudodama generatyvųjį AI nauju būdu, kad pagerintų kalbos aiškumą filmuose.

AI-coustics debiutavo gavęs 1,9 milijono eurų finansavimą ir siūlo technologiją, kuri viršija tradicinį triukšmo slopinimą. Pasak Fabiano Seipelio, įkūrėjo ir generalinio direktoriaus, jų technologija sukurta siekiant pagerinti garso kokybę visuose įrenginiuose ir garsiakalbiuose.

Jų tikslas yra padaryti visas skaitmenines sąveikas tokias pat aiškias kaip studijos transliacijos, nesvarbu, ar tai konferencinis skambutis, ar socialinės žiniasklaidos vaizdo įrašas.

AI-coustics buvo sukurtas 2021 m. dėl abipusio garso inžinieriaus Seipelio ir Berlyno technikos universiteto mašininio mokymosi dėstytojo Corvin Jaedicke nepasitenkinimo dėl prastos internetinio švietimo turinio garso kokybės. Paties Seipelio kovos su klausos praradimu dėl ankstyvo darbo muzikos kūrimo srityje yra įkvėpimas už jo asmeninę misiją pagerinti skaitmeninio garso aiškumą.

AI-coustics išskiria save perpildytoje AI palaikančių balso tobulinimo produktų srityje kūrybišku požiūriu į triukšmo mažinimo technologijų kūrimą.

Verslo algoritmas, apdovanojantis vartotojus už mokymo duomenų rinkinio papildymą, yra pagrįstas kalbos pavyzdžiais, užfiksuotais jų Berlyno studijoje. Tada jie naudoja šį duomenų rinkinį, kad pagerintų savo triukšmo mažinimo AI, kuri mokymo proceso metu tiksliai imituoja įvairius garso trūkumus.

Vis dėlto susirūpinimą kelia bendraautorių vienkartinio mokėjimo metodas ir galimas kalbos atpažinimo šališkumas. Siekdama atremti išankstinį nusistatymą, AI-coustics yra skirta įvairinti savo bendradarbių bazę, kad būtų užtikrintas technologijos veiksmingumas visuose kalbiniuose ir demografiniuose kontekstuose.

Trys skirtingi vaizdo klipai buvo paleisti naudojant AI-coustics platformą, siekiant įvertinti technologijos efektyvumą. Rezultatai parodė reikšmingą kalbos aiškumo pagerėjimą sumažinus foninį triukšmą.

AI-coustics tikisi panaudoti savo techniką tiek iš anksto įrašytai, tiek realiuoju laiku kalbos papildymui. Jis netgi gali įtraukti savo technologiją į plataus vartojimo prekes, kad automatiškai pagerintų balso kokybę. Šiuo metu paleisties programa suteikia SDK, žiniatinklio programą ir API, kad būtų lengviau apdoroti garso ir vaizdo įrašus.

Derindama užsakomųjų, prenumeratos ir licencijų pajamų srautus, AI-coustics pritraukė ir didelę vartotojų bazę, ir verslo klientų. Naudodama naujausią finansavimo ir paramos sistemą, bendrovė ketina plėsti savo darbo jėgą ir tobulinti kalbos tobulinimo strategiją, kad atitiktų rinkos lūkesčius ir derėtųsi dėl rizikos kapitalo ekosistemos.

Reaguodamas į nuogąstavimus, kad dirbtinis intelektas (AI) gali pakeisti darbuotojus, Seipel pabrėžia, kaip AI-coustics gali pagreitinti garso kūrimo procesą, atlaisvindamas žmonių inžinierius kitoms pareigoms, tuo pačiu užtikrindamas aukštos kokybės balso išvestį. Startuolio technologija žada platų pritaikymą visuose įrenginiuose ir turinyje, siekiant išspręsti plačiai paplitusią prastos garso kokybės skaitmeninėje komunikacijoje problemą.

Išmokite dirbtinio intelekto, mašininio mokymosi ir duomenų analizės Code Labs Academy ir vos per kelis mėnesius tapkite sertifikuotu duomenų mokslininku.*