Lydteknikere sliter ofte med opptak tilsmusset av bakgrunnsstøy, men et tysk firma kalt AI-coustics prøver å endre dette ved å bruke generativ AI på en ny måte for å forbedre taleklarheten i filmer.
AI-coustics debuterte med finansiering på €1,9 millioner, og tilbyr en teknologi som går utover tradisjonell støydemping. Ifølge Fabian Seipel, medgründer og administrerende direktør, er teknologien deres laget for å forbedre lydkvaliteten på tvers av alle enheter og høyttalere.
Målet deres er å gjøre alle digitale interaksjoner like tydelige som studiosendinger, enten det er en telefonkonferanse eller en video på sosiale medier.
AI-coustics ble etablert i 2021 som et resultat av den gjensidige misnøyen til lydingeniør Seipel og maskinlæringsforeleser ved det tekniske universitetet i Berlin Corvin Jaedicke, om den dårlige lydkvaliteten til nettbasert undervisningsinnhold. Seipels egne kamper med hørselstap fra hans tidlige arbeid med musikkproduksjon er inspirasjonen bak hans personlige oppdrag om å forbedre digital lydklarhet.
AI-coustics skiller seg ut i det overfylte feltet av AI-aktiverte stemmeforbedringsprodukter med sin kreative tilnærming til støyreduksjonsteknologiutvikling.
Virksomhetens algoritme, som belønner brukere for å legge til opplæringsdatasettet deres, er basert på taleprøver som ble fanget i Berlin-studioet deres. De bruker deretter dette datasettet til å forbedre deres støyreduksjon AI, som under treningsprosessen nøyaktig etterligner en rekke lydfeil.
Det eksisterer imidlertid bekymringer angående bidragsyternes engangsbetalingstilnærming og mulige talegjenkjenningsskjevheter. For å motvirke fordommer, er AI-coustics dedikert til å diversifisere bidragsyterbasen for å garantere effektiviteten til teknologien i alle språklige kontekster og demografiske kontekster.
Tre forskjellige videoklipp ble kjørt via AI-coustics sin plattform for å evaluere effektiviteten til teknologien. Resultatene viste en betydelig forbedring i taleklarhet ved å redusere bakgrunnsstøy.
AI-coustics håper å bruke teknikken deres for både forhåndsinnspilt og sanntids taleforsterkning. Det kan til og med inkorporere teknologien sin i forbruksvarer for automatisk å øke talekvaliteten. For øyeblikket tilbyr oppstarten en SDK, nettapplikasjon og API for å gjøre etterbehandling av lyd og video enklere.
Med en kombinasjon av on-demand, abonnementsbaserte og lisensinntektsstrømmer, har AI-coustics tiltrukket både en stor brukerbase og bedriftskunder. Ved å bruke det nylige finansierings- og støttesystemet, har selskapet til hensikt å øke arbeidsstyrken og forbedre taleforbedringsstrategien for å møte markedets forventninger og forhandle om risikokapitaløkosystemet.
Som svar på bekymringer om at kunstig intelligens (AI) kan erstatte arbeidere, understreker Seipel hvordan AI-kustikk kan fremskynde lydproduksjonsprosessen, og frigjøre menneskelige ingeniører for andre oppgaver samtidig som den garanterer høykvalitets stemmeutgang. Oppstartens teknologi lover bred anvendelighet på tvers av enheter og innhold, med sikte på å løse det utbredte problemet med dårlig lydkvalitet i digital kommunikasjon.
Lær AI, maskinlæring og dataanalyse på Code Labs Academy og bli en sertifisert dataforsker på bare måneder.