Зверніться до нашої нової Data Science & AI і Cybersecurity Заочні когорти

Google AI представляє «Коректуру»: функція Gboard для легкого виправлення речень і абзаців

Google AI представляє «Коректуру»: функція Gboard для легкого виправлення речень і абзаців

Google AI нещодавно представив нову функцію під назвою «Коригування» для Gboard, популярної мобільної програми для клавіатури. Одним дотиком ця функція дозволяє безперебійно вносити зміни та виправлення на рівні речень і абзаців, покращуючи загальний досвід друку.

Вирішення проблеми «жирного пальця».

Gboard використовує статистичне декодування як засіб вирішення проблеми «жирного пальця», яка є природною неточністю сенсорного введення на маленьких екранах. Дослідження показують, що рівень помилок на лист може досягати 8-9 відсотків без декодування. Gboard має кілька функцій виправлення помилок, які спрощують і роблять введення тексту зручнішим. Ці функції поєднують завдання, виконані вручну за участю людини, із проактивними автоматизованими виправленнями.

Комплексні засоби виправлення помилок

Функції Gboard, які включають завершення слів, передбачення наступного слова, активне автовиправлення (AC) і активне виправлення клавіш (KC), спрощують введення тексту. Ці інструменти включають інтелектуальну композицію, виправлення помилок і кілька слів-кандидатів на панелі пропозицій або вбудованих. Посткорекція (ПК) також полегшує виправлення помилок у словах, які вже були допущені. Незважаючи на ці функції, два ключові обмеження погіршують взаємодію з користувачем.

  1. Хоча моделі корекції на пристрої, такі як KC, AC і PC, швидкі та компактні, вони мають труднощі з обробкою складних і складних помилок, які потребують більш тривалого контексту. Щоб запобігти активації цих моделей, користувачі повинні друкувати повільно й точно.

  2. Швидкість набору тексту зменшується внаслідок того, що користувачам доводиться вручну виправляти введені слова за допомогою граматики та перевірки орфографії, що може бути важким для розуму та зору.

Необхідність виправлення помилок високого рівня

Люди, які швидко друкують, часто ігнорують слова, які вони вже набрали, і зосереджуються лише на клавіатурі. Через це може виникнути більш високий рівень помилок, що потребуватиме використання речень або механізмів виправлення вищого рівня.

Представляємо Коректуру

Коректура вирішує ці часті скарги, пропонуючи помітне підвищення продуктивності. Це спрощує виправлення помилок, надаючи виправлення на рівні речень і абзаців одним дотиком.

Технологія коректури

Функція перевірки складається з чотирьох основних компонентів: створення даних, проектування показників, налаштування моделі та обслуговування моделі. Разом усі ці компоненти гарантують ефективність. Щоб гарантувати, що розподіл даних відповідає домену Gboard, система імітує часті помилки клавіатури за допомогою точної та методично побудованої синтетичної архітектури помилок.

Розширені показники та оптимізація моделі

Щоб оцінити модель, дослідники включили ряд показників, з особливим наголосом на перевірці наявності граматичних помилок і подібних перевірках значення, отриманих з великих мовних моделей (LLM). Для покращення моделі в техніці InstructGPT використовуються контрольоване точне налаштування та налаштування навчання з підкріпленням (RL). Завдяки цій процедурі ефективність перевірки моделі значно покращується.

Розгортання та продуктивність

Використовуючи 8-бітове квантування, LLM PaLM2-XS середнього розміру розроблено для розміщення в одному TPU v5 і служить основою для функції перевірки. Оптимізація знижує вартість обслуговування. Попередні дослідження показали, що сегментація, спекулятивне декодування та ключі сегментів можуть зменшити затримку.

Реальний вплив

Десятки тисяч користувачів Pixel 8 отримають вигоду від високоякісних редагувань, що надаються функцією Proofread, яка тепер доступна. Ретельна генерація синтетичних даних і кілька ітерацій тонкого налаштування створили модель, яка істотно знижує кількість граматичних помилок, про що свідчить відносне зниження на 5,74 відсотка коефіцієнта Bad моделі PaLM2-XS. Крім того, оптимізація призвела до зменшення середньої затримки на 39,4%.

Майбутні перспективи

Це дослідження демонструє, як магістерські програми можуть покращити роботу користувачів і створити інтригуючі можливості для подальшого дослідження. Використання даних реального користувача, багатомовна підтримка, індивідуальна допомога при написанні та рішення щодо конфіденційності пристроїв є кількома прикладами областей, які можуть сприяти подальшому прогресу в секторі.

Google AI розширює можливості технології мобільної клавіатури за допомогою функції Proofread, що покращує набір тексту для людей у ​​всьому світі.

Code Labs Academy © 2024 Всі права захищені.