AI-coustics: Startup mający na celu doskonałą jakość dźwięku cyfrowego dzięki generatywnej sztucznej inteligencji

Zaktualizowano na November 19, 2024 2 Przeczytaj minuty

Inżynierowie dźwięku często borykają się z nagraniami zanieczyszczonymi szumami tła, ale niemiecka firma AI-coustics próbuje to zmienić, wykorzystując generatywną sztuczną inteligencję w nowatorski sposób, aby poprawić klarowność mowy w filmach.

AI-coustics zadebiutowała z finansowaniem w wysokości 1,9 miliona euro, oferując technologię wykraczającą poza tradycyjne tłumienie hałasu. Według Fabiana Seipela, współzałożyciela i dyrektora generalnego, ich technologia ma na celu poprawę jakości dźwięku na wszystkich urządzeniach i głośnikach.

Ich celem jest sprawienie, aby wszystkie interakcje cyfrowe były tak wyraźne jak transmisje studyjne, niezależnie od tego, czy jest to telekonferencja, czy wideo w mediach społecznościowych.

Firma AI-coustics powstała w 2021 roku w wyniku wzajemnego niezadowolenia inżyniera dźwięku Seipela i wykładowcy uczenia maszynowego na Uniwersytecie Technicznym w Berlinie Corvina Jaedicke’a w związku ze słabą jakością dźwięku treści edukacyjnych online. Zmagania Seipela z ubytkiem słuchu, które towarzyszyły mu na początku jego pracy przy produkcji muzycznej, stały się inspiracją dla jego osobistej misji poprawy przejrzystości dźwięku cyfrowego.

AI-coustics wyróżnia się na zatłoczonym polu produktów do poprawy głosu wykorzystujących sztuczną inteligencję dzięki kreatywnemu podejściu do rozwoju technologii redukcji hałasu.

Algorytm firmy, który nagradza użytkowników za dodanie do zbioru danych szkoleniowych, opiera się na próbkach mowy przechwyconych w ich berlińskim studiu. Następnie wykorzystują ten zbiór danych do udoskonalenia sztucznej inteligencji redukującej hałas, która podczas procesu uczenia dokładnie naśladuje różne wady dźwięku.

Istnieją jednak obawy dotyczące jednorazowego podejścia do płatności przez darczyńców i możliwych błędów w rozpoznawaniu mowy. Aby przeciwdziałać uprzedzeniom, AI-coustics stara się dywersyfikować bazę swoich autorów, aby zagwarantować skuteczność technologii we wszystkich kontekstach językowych i demograficznych.

Aby ocenić skuteczność tej technologii, za pośrednictwem platformy AI-coustics uruchomiono trzy różne klipy wideo. Wyniki wykazały znaczną poprawę przejrzystości mowy poprzez zmniejszenie hałasu w tle.

AI-coustics ma nadzieję wykorzystać swoją technikę zarówno do wzmacniania mowy nagranej wcześniej, jak i w czasie rzeczywistym. Może nawet włączyć swoją technologię do towarów konsumpcyjnych, aby automatycznie poprawić jakość głosu. W tej chwili startup udostępnia SDK, aplikację internetową i API, które ułatwiają końcowe przetwarzanie audio i wideo.

Dzięki połączeniu strumieni dochodów na żądanie, subskrypcji i licencji sztuczna inteligencja przyciągnęła zarówno dużą bazę użytkowników, jak i klientów korporacyjnych. Korzystając z najnowszego systemu finansowania i wsparcia, firma zamierza zwiększyć liczbę pracowników i ulepszyć swoją strategię poprawy mowy, aby sprostać oczekiwaniom rynku i negocjować ekosystem kapitału wysokiego ryzyka.

W odpowiedzi na obawy, że sztuczna inteligencja (AI) może zastąpić pracowników, Seipel podkreśla, w jaki sposób akustyka AI może przyspieszyć proces produkcji dźwięku, zwalniając inżynierów do innych obowiązków, gwarantując jednocześnie wysoką jakość dźwięku. Technologia startupu zapewnia szerokie zastosowanie na różnych urządzeniach i treściach, a jej celem jest rozwiązanie powszechnego problemu słabej jakości dźwięku w komunikacji cyfrowej.

Naucz się sztucznej inteligencji, uczenia maszynowego i analityki danych w Code Labs Academy i zostań certyfikowanym analitykiem danych w ciągu zaledwie kilku miesięcy.