Inżynierowie dźwięku często zmagają się z nagraniami skażonymi hałasem w tle, ale niemiecka firma o nazwie AI-coustics próbuje to zmienić, wykorzystując generatywną sztuczną inteligencję w nowatorski sposób, aby poprawić wyrazistość mowy w filmach.
AI-coustics zadebiutowała z finansowaniem w wysokości 1,9 miliona euro, oferując technologię, która wykracza poza tradycyjne tłumienie hałasu. Według Fabiana Seipela, współzałożyciela i dyrektora generalnego, ich technologia ma na celu poprawę jakości dźwięku we wszystkich urządzeniach i głośnikach.
Ich celem jest uczynienie wszystkich interakcji cyfrowych tak wyraźnymi, jak transmisje studyjne, niezależnie od tego, czy jest to połączenie konferencyjne, czy wideo w mediach społecznościowych.
Firma AI-coustics powstała w 2021 roku w wyniku wzajemnego niezadowolenia inżyniera dźwięku Seipela i wykładowcy uczenia maszynowego na Uniwersytecie Technicznym w Berlinie Corvina Jaedicke'a z powodu niskiej jakości dźwięku treści edukacyjnych online. Własne zmagania Seipela z ubytkiem słuchu z wczesnej pracy w produkcji muzycznej są inspiracją dla jego osobistej misji poprawy czystości dźwięku cyfrowego.
AI-coustics wyróżnia się na zatłoczonym polu produktów do poprawy głosu z obsługą AI dzięki kreatywnemu podejściu do rozwoju technologii redukcji szumów.
Algorytm firmy, który nagradza użytkowników za dodawanie do ich zbioru danych szkoleniowych, opiera się na próbkach mowy, które zostały przechwycone w ich berlińskim studiu. Następnie wykorzystują ten zbiór danych do ulepszenia swojej sztucznej inteligencji redukcji szumów, która podczas procesu szkolenia dokładnie naśladuje różne wady dźwięku.
Istnieją jednak obawy dotyczące jednorazowej płatności i możliwych uprzedzeń w rozpoznawaniu mowy. Aby przeciwdziałać uprzedzeniom, AI-coustics dąży do dywersyfikacji swojej bazy współpracowników, aby zagwarantować skuteczność technologii we wszystkich kontekstach językowych i demograficznych.
Trzy różne klipy wideo zostały uruchomione za pośrednictwem platformy AI-coustics w celu oceny skuteczności technologii. Wyniki wykazały znaczną poprawę wyrazistości mowy poprzez zmniejszenie szumów tła.
AI-coustics ma nadzieję wykorzystać swoją technikę zarówno do nagrywania, jak i wzmacniania mowy w czasie rzeczywistym. Może nawet włączyć swoją technologię do towarów konsumpcyjnych, aby automatycznie poprawić jakość głosu. Obecnie startup udostępnia SDK, aplikację internetową i API, aby ułatwić przetwarzanie dźwięku i obrazu.
Dzięki połączeniu strumieni przychodów na żądanie, opartych na subskrypcji i licencji, AI-coustics przyciągnęła zarówno dużą bazę użytkowników, jak i klientów korporacyjnych. Korzystając z niedawnego finansowania i systemu wsparcia, firma zamierza zwiększyć siłę roboczą i ulepszyć strategię poprawy mowy, aby sprostać oczekiwaniom rynku i negocjować ekosystem kapitału wysokiego ryzyka.
W odpowiedzi na obawy, że sztuczna inteligencja (AI) może zastąpić pracowników, Seipel podkreśla, w jaki sposób akustyka AI może przyspieszyć proces produkcji dźwięku, uwalniając ludzkich inżynierów do innych obowiązków, gwarantując jednocześnie wysoką jakość dźwięku. Technologia startupu obiecuje szerokie zastosowanie w różnych urządzeniach i treściach, mając na celu rozwiązanie powszechnego problemu niskiej jakości dźwięku w komunikacji cyfrowej.