Google AI が「校正」を公開: 文章や段落を簡単に修正できる Gboard 機能

Google AI が「校正」を公開: 文章や段落を簡単に修正できる Gboard 機能

Google AI は最近、人気のモバイル キーボード アプリケーションである Gboard に「Proofread」と呼ばれる新機能を導入しました。この機能により、ワンタップで文および段落レベルでのシームレスな変更と修正が可能になり、全体的な入力エクスペリエンスが向上します。

「ファットフィンガー」問題への取り組み

Gboard は、小さな画面でのタッチ入力の自然な不正確さである「ファットフィンガー」問題に対処する手段として統計的デコードを使用しています。研究によると、デコードしない場合、文字あたりのエラー率は 8 ~ 9% に達する可能性があります。 Gboard には、入力をより簡単かつスムーズにするためのいくつかのエラー修正機能が付属しています。これらの機能は、人による入力を伴う手動タスクとプロアクティブな自動修正を組み合わせたものです。

包括的なエラー修正ツール

単語補完、次の単語の予測、アクティブ自動修正 (AC)、アクティブ キー修正 (KC) などの Gboard の機能を利用すると、入力がさらに簡単になります。これらのツールには、スマート構成、エラー修正、提案バーまたはインラインでの複数の単語の候補が含まれます。事後修正 (PC) を使用すると、すでにコミットされた単語のエラーの修正も容易になります。これらの機能にもかかわらず、2 つの重要な制限によりユーザー エクスペリエンスが損なわれます。

  1. KC、AC、PC などのオンデバイス修正モデルは高速かつコンパクトですが、より長いコンテキストを必要とする高度で複雑なエラーを処理するのが困難です。これらのモデルがアクティブ化されないようにするには、ユーザーはゆっくりと正確に入力する必要があります。

  2. ユーザーが文法チェッカーやスペル チェッカーを使用して確定した単語を手動で修正する必要があるため、入力速度が低下し、精神的および視覚的に負担がかかる可能性があります。

高レベルのエラー修正の必要性

タイピングの速い人は、すでに入力した単語を無視してキーボードだけに集中することがよくあります。これによりエラー率が高くなる可能性があり、文またはより高レベルの修正メカニズムの使用が必要になります。

校正の紹介

Proofread は、顕著な生産性の向上を提供することで、これらの頻繁な苦情を解決します。ワンタップで文レベルおよび段落レベルの修正ができるため、エラー修正が簡単になります。

校正の背後にあるテクノロジー

Proofread 機能は、データ生成、メトリクス設計、モデル調整、モデル提供という 4 つの主要コンポーネントで構成されています。これらすべてのコンポーネントを組み合わせることで、効果が保証されます。データ配信が Gboard ドメインと一致していることを保証するために、システムは、正確かつ体系的に構築されたエラー合成アーキテクチャを使用して、頻繁なキーボード エラーを模倣します。

高度なメトリクスとモデルの最適化

モデルを評価するために、研究者は、大規模言語モデル (LLM) から派生した文法エラーの存在チェックと同様の意味チェックに特に重点を置いた、多くの指標を組み込んでいます。 InstructGPT 手法では、モデルを改善するために教師あり微調整と強化学習 (RL) 調整が使用されます。この手順により、モデルの校正パフォーマンスが大幅に向上します。

導入とパフォーマンス

8 ビット量子化を使用する中型 LLM PaLM2-XS は、単一の TPU v5 内に収まるように調整されており、Proofread 機能の基盤として機能します。最適化により、サービスのコストが削減されます。以前の研究では、セグメンテーション、投機的デコード、およびバケット キーによってレイテンシが短縮されることが実証されています。

現実世界への影響

何万人もの Pixel 8 ユーザーが、現在利用可能になっている Proofread 機能によって提供される高品質な編集の恩恵を受けることになります。 PaLM2-XS モデルの Bad 率が相対的に 5.74% 減少していることからわかるように、合成データを徹底的に生成し、数回の微調整を繰り返すことで、文法エラーを大幅に低減するモデルが生成されました。さらに、最適化によりレイテンシの中央値が 39.4% 減少しました。

今後の展望

この研究 は、LLM がどのようにユーザー エクスペリエンスを向上させ、さらなる調査のための興味深い可能性を生み出す可能性があるかを示しています。実際のユーザー データの使用、多言語サポート、カスタマイズされたライティング支援、デバイス プライバシー ソリューションは、この分野のさらなる進歩につながる可能性のある分野の例です。

Google AI は、Proofread 機能の導入によりモバイル キーボード テクノロジーの可能性を拡大し、世界中の人々のタイピングを向上させています。

Code Labs Academy © 2024 無断転載を禁じます.