音频工程师经常会遇到被背景噪音污染的录音,但一家名为 AI-coustics 的德国公司正试图改变这一现状,以一种新颖的方式使用生成式人工智能来提高电影中的语音清晰度。
AI-coustics 首次亮相,融资 190 万欧元,提供超越传统噪声抑制的技术。联合创始人兼首席执行官 Fabian Seipel 表示,他们的技术旨在提高所有设备和扬声器的音频质量。
他们的目标是让所有数字交互都像演播室广播一样清晰,无论是电话会议还是社交媒体视频。
AI-coustics 成立于 2021 年,原因是音频工程师 Seipel 和柏林技术大学机器学习讲师 Corvin Jaedicke 对在线教育内容的音频质量不佳相互不满。塞佩尔自己在早期音乐制作工作中与听力损失作斗争,这启发了他提高数字音频清晰度的个人使命。
AI-coustics 凭借其创新的降噪技术开发方法,在人工智能语音改善产品的竞争激烈的领域中脱颖而出。
该公司的算法基于在柏林工作室捕获的语音样本,对添加到训练数据集的用户进行奖励。然后,他们使用该数据集来改进降噪人工智能,该人工智能在训练过程中可以准确地模仿各种音频缺陷。
不过,对于贡献者的一次性付款方式和可能的语音识别偏差,人们仍然存在担忧。为了消除偏见,AI-coustics 致力于使其贡献者基础多样化,以保证该技术在所有语言背景和人口背景下的有效性。
通过 AI-coustics 平台运行三个不同的视频片段来评估该技术的功效。结果表明,通过降低背景噪音,语音清晰度得到显着改善。
AI-coustics 希望将他们的技术用于预录和实时语音增强。它甚至可能将其技术融入消费品中,以自动提高语音质量。目前,该初创公司提供了 SDK、Web 应用程序和 API,使音频和视频后处理变得更加容易。
凭借按需、订阅和许可收入流的结合,AI-coustics 吸引了庞大的用户群和企业客户。该公司打算利用其最近的融资和支持系统来扩大员工队伍并改进其语音增强策略,以满足市场期望并协商风险投资生态系统。
为了回应对人工智能 (AI) 可能取代工人的担忧,Seipel 强调了 AI 声学如何加快音频制作过程,将人类工程师从其他职责中解放出来,同时保证高质量的语音输出。该初创公司的技术承诺跨设备和内容的广泛适用性,旨在解决数字通信中普遍存在的音频质量差的问题。