小型人工智能模型为科技巨头带来的巨大好处

小型人工智能模型为科技巨头带来的巨大好处

为了复制人类智能,人工智能军备竞赛的焦点最初集中在创建在广泛数据集上训练的大规模模型。然而,近年来出现了显着的转变,科技巨头和初创公司越来越多地将注意力转向更精简、更专业、更便宜、更快的人工智能软件。

这些中小型语言模型专门针对特定任务而设计,并使用较少的数据进行训练,因此获得了广泛的欢迎。与大型同类产品不同,它们的开发成本不到 1000 万美元,并且使用的参数少于 100 亿个。相比之下,OpenAI 的 GPT-4o 是最大的模型之一,需要超过 1 亿美元来构建并使用超过一万亿个参数。这些模型的尺寸较小,意味着计算能力要求较低,每次查询的价格也较低。

例如,微软重点关注其 Phi 系列小型机型。微软首席执行官 Satya Nadella 声称,这些模型的大小只有 OpenAI ChatGPT 背后模型的 1/100,但它们可以以相当的效率处理许多任务。微软首席商务官 Yusuf Mehdi 强调了针对不同任务使用不同模型的需求,并指出运行大型模型的相关成本高于预期。此外,微软最近推出了人工智能笔记本电脑,利用大量人工智能模型进行搜索和图像生成。这些模型在设备本身上运行,而不依赖于大量基于云的超级计算机,就像 ChatGPT 的情况一样。

谷歌等其他公司以及 Mistral、Anthropic 和 Cohere 等人工智能初创公司也发布了较小的模型。此外,苹果还公布了集成小型模型的计划,以提高手机上人工智能操作的速度和安全性。

以崇尚大模型而闻名的OpenAI推出了其旗舰模型的更实惠版本,并打算在未来重点开发更小的模型。事实证明,大型模型对于文档摘要或图像生成等任务来说太过分了,类似于使用坦克进行简单的杂货购物之旅。另一方面,较小的型号可以以低得多的成本提供类似的性能。这些模型通常是针对特定任务(例如管理法律文件或内部通信)量身定制的。 AI21 实验室的 Yoav Shoham 断言,小型模型在经济上更适合广泛使用,其成本仅为大型模型的一小部分,同时还能提供问题的答案。

企业很容易采用这些较小的模型来提高效率并降低成本。例如,Experian 为其人工智能聊天机器人过渡到较小的模型,并以较低的成本实现了与较大模型相似的性能。 Salesforce 的 Clara Shih 强调了较小模型的实用性,因为模型通常会导致过多的支出和延迟问题。

自OpenAI发布GPT-4以来,大型模型开发一直没有重大进展,导致进展停滞。因此,人们的努力已转向提高较小模型的效率。 Microsoft 的 Sébastien Bubeck 注意到当前大型开发的暂停,并鼓励努力提高效率。

尽管发生了这种转变,大型模型对于高级任务仍然具有价值。 Apple 和 Microsoft 等公司继续整合大型模型,例如尽管这些集成通常只占其整体人工智能计划的一小部分,但将 ChatGPT 等集成到他们的产品中。这一进展标志着人工智能从未来演示到实用商业广告的转变。

Code Labs Academy © 2025 版权所有.