Google AI 最近为流行的移动键盘应用程序 Gboard 引入了一项名为“校对”的新功能。只需轻按一下,此功能就可以在句子和段落级别进行无缝修改和更正,从而改善整体打字体验。
解决“胖手指”问题
Gboard 使用统计解码来解决“胖手指”问题,这是小屏幕上触摸输入自然不准确的问题。研究表明,在不解码的情况下,每个字母的错误率可达 8% 至 9%。 Gboard 配备了多项纠错功能,使打字变得更轻松、更流畅。这些功能将涉及人工输入的手动任务与主动、自动更正结合起来。
全面的纠错工具
Gboard 的功能使打字变得更加容易,其中包括单词补全、下一个单词预测、主动自动更正 (AC) 和主动键更正 (KC)。这些工具包括智能写作、纠错以及建议栏或内联中的多词候选。后更正(PC)还有助于纠正已经犯下的单词错误。尽管有这些功能,但有两个关键限制会损害用户体验。
-
虽然 KC、AC 和 PC 等设备上校正模型快速且紧凑,但它们难以处理需要较长上下文的复杂错误。为了防止这些模型被激活,用户必须缓慢而准确地打字。
-
由于用户必须使用语法和拼写检查器手动更正输入的单词,因此打字速度会降低,这可能会造成精神和视觉上的负担。
高级纠错的必要性
打字速度快的人经常会忽略他们已经输入的单词,而只专注于键盘。由此可能会产生更高的错误率,需要使用句子或更高级的纠正机制。
校对介绍
校对通过显着提高生产力来解决这些常见的投诉。它通过提供一键式句子和段落级别更正,使错误更正变得更简单。
校对背后的技术
校对功能由四个主要组件组成:数据生产、指标设计、模型调整和模型服务。所有这些组件共同保证了有效性。为了确保数据分布符合 Gboard 域,系统使用精确且有条理构建的错误合成架构来模拟频繁的键盘错误。
高级指标和模型优化
为了评估该模型,研究人员纳入了许多指标,特别强调语法错误存在检查和源自大型语言模型 (LLM) 的相似含义检查。 InstructGPT 技术中使用监督微调和强化学习 (RL) 调整来改进模型。通过此过程大大提高了模型的校对性能。
部署和性能
使用 8 位量化,中型 LLM PaLM2-XS 经过定制,适合单个 TPU v5 内部,并作为校对功能的基础。优化降低了服务成本。先前的研究表明,分段、推测解码和存储桶密钥可以减少延迟。
现实世界的影响
数以万计的 Pixel 8 用户将受益于现已推出的校对功能提供的高质量编辑。彻底生成合成数据和多次迭代微调已经产生了一个显着降低语法错误的模型,PaLM2-XS 模型的不良率相对下降了 5.74%。此外,优化还使中位延迟减少了 39.4%。
未来展望
这项研究 展示了法学硕士如何增强用户体验并为进一步研究创造有趣的可能性。真实用户数据的使用、多语言支持、定制写作帮助和设备隐私解决方案是可能导致该行业进一步进步的一些领域的例子。
通过引入校对功能,Google AI 正在扩展移动键盘技术的可能性,从而改善世界各地人们的打字体验。