Аудиоинженерам часто приходится бороться с записями, испорченными фоновым шумом, но немецкая фирма AI-coustics пытается изменить это, используя новый способ генеративного искусственного интеллекта для улучшения разборчивости речи в фильмах.
AI-кустика дебютировала с финансированием в 1,9 миллиона евро, предложив технологию, выходящую за рамки традиционного шумоподавления. По словам Фабиана Зайпеля, соучредителя и генерального директора, их технология создана для улучшения качества звука на всех устройствах и динамиках.
Их цель — сделать все цифровые взаимодействия такими же понятными, как студийные трансляции, будь то конференц-связь или видео в социальных сетях.
AI-coustics была создана в 2021 году в результате взаимного недовольства аудиоинженера Зайпеля и преподавателя машинного обучения Берлинского технического университета Корвина Йедике по поводу плохого качества звука образовательного онлайн-контента. Борьба Зайпеля с потерей слуха, возникшая в результате его ранней работы в сфере музыкального производства, вдохновила его личную миссию по повышению четкости цифрового звука.
AI-coustics выделяется на рынке продуктов для улучшения голоса с поддержкой искусственного интеллекта своим творческим подходом к разработке технологий шумоподавления.
Алгоритм компании, который вознаграждает пользователей за добавление к их набору обучающих данных, основан на образцах речи, записанных в их берлинской студии. Затем они используют этот набор данных для улучшения своего искусственного интеллекта по шумоподавлению, который в процессе обучения точно имитирует различные дефекты звука.
Однако существуют опасения по поводу единовременной оплаты вкладчиков и возможных ошибок в распознавании речи. Чтобы противодействовать предрассудкам, AI-coustics стремится диверсифицировать свою базу участников, чтобы гарантировать эффективность технологии во всех языковых и демографических контекстах.
Для оценки эффективности технологии через платформу AI-coustics были запущены три разных видеоклипа. Результаты показали значительное улучшение четкости речи за счет снижения фонового шума.
AI-coustics надеется использовать свою технику как для предварительно записанной речи, так и для улучшения речи в реальном времени. Она может даже внедрить свою технологию в потребительские товары, чтобы автоматически повысить качество голоса. На данный момент стартап предоставляет SDK, веб-приложение и API для упрощения постобработки аудио и видео.
Благодаря сочетанию потоков доходов по требованию, на основе подписки и лицензий, ИИ-кустика привлекла как большую базу пользователей, так и корпоративных клиентов. Используя свою новейшую систему финансирования и поддержки, компания намерена расширить свой штат сотрудников и улучшить свою стратегию улучшения речи, чтобы оправдать ожидания рынка и договориться об экосистеме венчурного капитала.
В ответ на опасения, что искусственный интеллект (ИИ) может заменить рабочих, Зайпель подчеркивает, что ИИ-акустика может ускорить процесс производства звука, освобождая инженеров-людей для других обязанностей и одновременно гарантируя высокое качество вывода голоса. Технология стартапа обещает широкое применение на всех устройствах и в контенте, стремясь решить широко распространенную проблему низкого качества звука в цифровой связи.
Изучите искусственный интеллект, машинное обучение и анализ данных в Code Labs Academy и станьте сертифицированным специалистом по данным всего за несколько месяцев.