Google AI представляет «Корректуру»: функцию Gboard для удобного исправления предложений и абзацев

Обновлено на June 25, 2024 3 Прочнет минуты

Google AI недавно представил новую функцию под названием «Коррекция» в Gboard, популярном мобильном приложении для клавиатуры. Эта функция позволяет одним касанием вносить плавные изменения и исправления на уровне предложений и абзацев, улучшая общее удобство набора текста.

Решение проблемы «толстых пальцев»

Gboard использует статистическое декодирование как средство решения проблемы «толстых пальцев», то есть естественной неточности сенсорного ввода на маленьких экранах. Исследования показывают, что без декодирования доля ошибок на букву может достигать 8–9 процентов. Gboard оснащен несколькими функциями исправления ошибок, которые делают ввод текста более простым и плавным. Эти функции сочетают в себе ручные задачи, включающие участие человека, с упреждающими автоматическими исправлениями.

Комплексные инструменты исправления ошибок

Ввод текста упрощается благодаря функциям Gboard, которые включают завершение слов, прогнозирование следующего слова, активную автокоррекцию (AC) и активную коррекцию клавиш (KC). Эти инструменты включают интеллектуальную композицию, исправление ошибок и варианты из нескольких слов в строке предложений или в строке. Посткоррекция (ПК) также облегчает исправление уже допущенных ошибок в словах. Несмотря на эти функции, два ключевых ограничения ухудшают взаимодействие с пользователем.

Хотя модели коррекции на устройстве, такие как KC, AC и PC, быстрые и компактные, им трудно обрабатывать сложные и сложные ошибки, требующие более длительного контекста. Чтобы предотвратить активацию этих моделей, пользователи должны печатать медленно и точно.
Скорость набора текста снижается из-за того, что пользователям приходится вручную исправлять зафиксированные слова с помощью средств проверки грамматики и орфографии, что может быть утомительным как для умственного, так и для визуального восприятия.

Необходимость исправления ошибок высокого уровня

Быстро печатающие люди часто игнорируют уже набранные слова и концентрируются только на клавиатуре. В результате может возникнуть более высокий уровень ошибок, что потребует использования механизмов коррекции предложений или более высокого уровня.

Представляем корректуру

Корректура решает эти частые жалобы, предлагая заметное повышение производительности. Это упрощает исправление ошибок, обеспечивая исправления на уровне предложений и абзацев одним касанием.

Технология корректуры

Функция корректуры состоит из четырех основных компонентов: производство данных, разработка метрик, настройка модели и обслуживание модели. Вместе все эти компоненты гарантируют эффективность. Чтобы гарантировать, что распределение данных соответствует домену Gboard, система имитирует частые ошибки клавиатуры, используя точно и методично построенную синтетическую архитектуру ошибок.

Расширенные метрики и оптимизация модели

Чтобы оценить модель, исследователи включили ряд показателей, уделив особое внимание проверкам на наличие грамматических ошибок и аналогичным проверкам значения, полученным на основе больших языковых моделей (LLM). Контролируемая точная настройка и настройка обучения с подкреплением (RL) используются в методе InstructGPT для улучшения модели. Благодаря этой процедуре производительность корректуры модели значительно повышается.

Развертывание и производительность

Используя 8-битное квантование, LLM PaLM2-XS среднего размера адаптирован для размещения в одном TPU v5 и служит основой для функции корректуры. Оптимизация снижает стоимость обслуживания. Предыдущие исследования показали, что сегментация, спекулятивное декодирование и ключи сегментов могут снизить задержку.

Влияние на реальный мир

Десятки тысяч пользователей Pixel 8 получат выгоду от высококачественных правок, предоставляемых функцией корректуры, которая теперь доступна. Тщательная генерация синтетических данных и несколько итераций тонкой настройки позволили создать модель, которая существенно снижает количество грамматических ошибок, о чем свидетельствует относительное снижение на 5,74 процента коэффициента Bad модели PaLM2-XS. Кроме того, оптимизация привела к снижению средней задержки на 39,4%.

Будущие перспективы

Это исследование демонстрирует, как LLM могут улучшить пользовательский опыт и создать интригующие возможности для дальнейших исследований. Использование данных реальных пользователей, многоязычная поддержка, индивидуальная помощь при письме и решения для обеспечения конфиденциальности устройств — вот несколько примеров областей, которые могут привести к дальнейшему прогрессу в этом секторе.

Google AI расширяет возможности технологии мобильных клавиатур с помощью функции корректуры, улучшая набор текста для людей по всему миру.