Google AI przedstawia „Korektę”: funkcję Gboard ułatwiającą poprawianie zdań i akapitów

Zaktualizowano na June 13, 2024 3 Przeczytaj minuty

Google AI niedawno wprowadziło nową funkcję o nazwie „Korekta” w Gboard, popularnej aplikacji na klawiaturę mobilną. Funkcja ta umożliwia płynne wprowadzanie modyfikacji i poprawek na poziomie zdań i akapitów jednym dotknięciem, poprawiając ogólną wygodę pisania.

Rozwiązanie problemu „grubego palca”.

Gboard wykorzystuje dekodowanie statystyczne, aby rozwiązać problem „grubego palca”, czyli naturalnej niedokładności wprowadzania dotykowego na małych ekranach. Badania pokazują, że bez dekodowania wskaźnik błędów na literę może sięgać od 8 do 9 procent. Gboard jest wyposażony w kilka funkcji korygujących błędy, dzięki którym pisanie jest łatwiejsze i płynniejsze. Funkcje te łączą ręczne zadania wymagające udziału człowieka z proaktywnymi, zautomatyzowanymi poprawkami.

Kompleksowe narzędzia do korekcji błędów

Pisanie jest łatwiejsze dzięki funkcjom Gboard, które obejmują uzupełnianie słów, przewidywanie następnego słowa, aktywną autokorektę (AC) i aktywną korektę klawiszy (KC). Narzędzia te obejmują inteligentną kompozycję, korekcję błędów i propozycje wielu słów na pasku sugestii lub w tekście. Postkorekta (PC) ułatwia także sprostowanie błędów w słowach, które już zostały popełnione. Pomimo tych funkcji, dwa kluczowe ograniczenia pogarszają wygodę użytkownika.

Chociaż modele korekcji na urządzeniu, takie jak KC, AC i PC, są szybkie i kompaktowe, mają trudności z obsługą wyrafinowanych i złożonych błędów, które wymagają dłuższych kontekstów. Aby zapobiec aktywacji tych modeli, użytkownicy muszą pisać powoli i precyzyjnie.
Szybkość pisania spada, ponieważ użytkownicy muszą ręcznie poprawiać wprowadzone słowa za pomocą modułów sprawdzania gramatyki i pisowni, co może być obciążające psychicznie i wizualnie.

Potrzeba korekcji błędów wysokiego poziomu

Osoby szybko piszące często ignorują słowa, które już napisały i koncentrują się wyłącznie na klawiaturze. Może to wynikać z wyższych poziomów błędów, co wymaga zastosowania mechanizmów korekcji zdań lub wyższego poziomu.

Przedstawiamy korektę

Korekta rozwiązuje te częste skargi, oferując znaczny wzrost produktywności. Ułatwia korekcję błędów, zapewniając poprawki na poziomie zdania i akapitu jednym dotknięciem.

Technologia korekty

Funkcja korekty składa się z czterech głównych komponentów: tworzenia danych, projektowania metryk, poprawiania modelu i udostępniania modelu. Wszystkie te składniki razem gwarantują skuteczność. Aby zapewnić zgodność dystrybucji danych z domeną Gboard, system naśladuje częste błędy klawiatury, korzystając z precyzyjnie i metodycznie zbudowanej architektury syntetycznej błędów.

Zaawansowane metryki i optymalizacja modelu

Aby ocenić model, badacze włączyli szereg wskaźników, ze szczególnym uwzględnieniem kontroli obecności błędów gramatycznych i podobnych kontroli znaczenia pochodzących z dużych modeli językowych (LLM). W technice InstructGPT stosuje się nadzorowane dostrajanie precyzyjne i dostrajanie poprzez uczenie się przez wzmacnianie (RL) w celu ulepszenia modelu. Ta procedura znacznie poprawia wydajność korekty modelu.

Wdrożenie i wydajność

Wykorzystując 8-bitową kwantyzację, średniej wielkości LLM PaLM2-XS jest dostosowany tak, aby zmieścił się w pojedynczym TPU v5 i służy jako podstawa funkcji Korekty. Optymalizacja obniża koszt obsługi. Wcześniejsze badania wykazały, że segmentacja, dekodowanie spekulatywne i klucze segmentowe mogą zmniejszyć opóźnienia.

Wpływ na świat rzeczywisty

Dziesiątki tysięcy użytkowników Pixela 8 skorzystają z wysokiej jakości edycji zapewnianych przez dostępną już funkcję Korekta. Dokładne generowanie danych syntetycznych i kilka iteracji dostrajania pozwoliło uzyskać model, który znacznie zmniejsza liczbę błędów gramatycznych, co widać po względnym zmniejszeniu współczynnika Bad modelu PaLM2-XS o 5,74%. Dodatkowo optymalizacje spowodowały zmniejszenie średniego opóźnienia o 39,4%.

Perspektywy na przyszłość

To badanie pokazuje, jak LLM mogą poprawić doświadczenia użytkowników i stworzyć intrygujące możliwości dalszych badań. Wykorzystanie danych rzeczywistych użytkowników, wsparcie wielojęzyczne, dostosowana pomoc w pisaniu i rozwiązania w zakresie prywatności urządzenia to tylko kilka przykładów obszarów, które mogą prowadzić do dalszego postępu w branży.

Google AI poszerza możliwości technologii klawiatur mobilnych, wprowadzając funkcję Korekty, usprawniając pisanie dla ludzi na całym świecie.