Zvukoví inženýři se často potýkají s nahrávkami poskvrněnými hlukem na pozadí, ale německá firma s názvem AI-coustics se to snaží změnit pomocí generativní umělé inteligence novým způsobem ke zlepšení srozumitelnosti řeči ve filmech.
AI-coustics debutovala s financováním ve výši 1,9 milionu EUR a nabízí technologii, která přesahuje tradiční potlačení hluku. Podle Fabiana Seipela, spoluzakladatele a generálního ředitele, je jejich technologie vytvořena pro zlepšení kvality zvuku na všech zařízeních a reproduktorech.
Jejich cílem je, aby všechny digitální interakce byly stejně jasné jako studiové vysílání, ať už jde o konferenční hovor nebo video na sociálních sítích.
AI-coustics byla založena v roce 2021 jako výsledek vzájemné nespokojenosti zvukového inženýra Seipela a lektora strojového učení na Technické univerzitě v Berlíně Corvina Jaedickeho ohledně špatné kvality zvuku online vzdělávacího obsahu. Seipelovy vlastní problémy se ztrátou sluchu z jeho rané práce v hudební produkci jsou inspirací pro jeho osobní poslání zlepšit čistotu digitálního zvuku.
AI-coustics se odlišuje v přeplněném poli produktů pro vylepšení hlasu s umělou inteligencí svým kreativním přístupem k vývoji technologie redukce šumu.
Algoritmus firmy, který odměňuje uživatele za přidání do jejich tréninkové datové sady, je založen na ukázkách řeči, které byly zachyceny v jejich berlínském studiu. Tuto datovou sadu pak použijí ke zlepšení své umělé inteligence pro redukci šumu, která během tréninkového procesu přesně napodobuje různé zvukové nedostatky.
Existují však obavy týkající se přístupu přispěvatelů k jednorázové platbě a možného zkreslení rozpoznávání řeči. Aby AI-coustics čelila předsudkům, věnuje se diverzifikaci své základny přispěvatelů, aby byla zaručena účinnost technologie ve všech jazykových a demografických kontextech.
Prostřednictvím platformy AI-coustics byly spuštěny tři různé videoklipy, aby se vyhodnotila účinnost technologie. Výsledky ukázaly významné zlepšení srozumitelnosti řeči snížením hluku na pozadí.
AI-coustics doufá, že využije jejich techniku jak pro přednahrané, tak pro rozšíření řeči v reálném čase. Svou technologii může dokonce začlenit do spotřebního zboží a automaticky zvýšit kvalitu hlasu. V tuto chvíli startup poskytuje SDK, webovou aplikaci a API, které usnadňují následné zpracování zvuku a videa.
Díky kombinaci zdrojů příjmu na vyžádání, na základě předplatného a licencí získala AI-coustics jak velkou uživatelskou základnu, tak podnikové klienty. Pomocí svého nedávného systému financování a podpory má společnost v úmyslu rozšířit svou pracovní sílu a zlepšit strategii zdokonalování řeči, aby splnila očekávání trhu a vyjednala ekosystém rizikového kapitálu.
V reakci na obavy, že umělá inteligence (AI) by mohla nahradit pracovníky, Seipel zdůrazňuje, jak může AI-coustics urychlit proces výroby zvuku, uvolnit lidské inženýry pro jiné povinnosti a zároveň zajistit vysoce kvalitní hlasový výstup. Technologie startupu slibuje širokou použitelnost napříč zařízeními a obsahem s cílem vyřešit rozšířený problém špatné kvality zvuku v digitální komunikaci.
Naučte se AI, strojové učení a analýzu dat na Code Labs Academy a staňte se certifikovaným datovým vědcem během několika měsíců.