Google AI razkriva 'lektoriranje': funkcija Gboard za enostavno popravljanje stavkov in odstavkov

Posodobljeno na August 08, 2024 3 minute preberite

Google AI je nedavno predstavil novo funkcijo, imenovano »Lektoriranje« za Gboard, priljubljeno aplikacijo za mobilno tipkovnico. Z enim samim dotikom ta funkcija omogoča brezhibne spremembe in popravke na ravni stavkov in odstavkov, kar izboljša splošno izkušnjo tipkanja.

Reševanje problema ‘debelega prsta’

Gboard uporablja statistično dekodiranje kot sredstvo za reševanje težave z “debelimi prsti”, ki je naravna netočnost vnosa na dotik na majhnih zaslonih. Raziskave kažejo, da lahko stopnja napak na črko doseže 8 do 9 odstotkov brez dekodiranja. Gboard ima več funkcij za odpravljanje napak, ki omogočajo lažje in bolj gladko tipkanje. Te funkcije združujejo ročna opravila, ki vključujejo človeški vnos, s proaktivnimi, samodejnimi popravki.

Obsežna orodja za popravljanje napak

Tipkanje skupaj olajšajo funkcije Gboard, ki vključujejo dokončanje besed, predvidevanje naslednje besede, aktivno samodejno popravljanje (AC) in aktivno popravljanje tipk (KC). Ta orodja vključujejo pametno sestavljanje, popravljanje napak in večbesedne kandidate v vrstici s predlogi ali v vrstici. Naknadno popravljanje (PC) prav tako olajša popravljanje napak v besedah, ki so že bile storjene. Kljub tem funkcijam uporabniško izkušnjo poslabšata dve ključni omejitvi.

Medtem ko so modeli popravkov v napravi, kot so KC, AC in PC, hitri in kompaktni, imajo težave pri obravnavi sofisticiranih in kompleksnih napak, ki potrebujejo daljše kontekste. Da bi preprečili aktiviranje teh modelov, morajo uporabniki tipkati počasi in natančno.
Hitrost tipkanja se zmanjša, ker morajo uporabniki ročno popravljati dodeljene besede s slovničnimi in črkovalniki, kar je lahko psihično in vizualno obremenjujoče.

Potreba po popravkih napak na visoki ravni

Hitri tipkalci pogosto ne upoštevajo besed, ki so jih že vnesli, in se osredotočijo samo na tipkovnico. Zaradi tega lahko nastanejo višje stopnje napak, zaradi česar je potrebna uporaba mehanizmov popravkov kazni ali višje ravni.

Predstavljamo lektoriranje

Lektoriranje rešuje te pogoste pritožbe tako, da ponuja opazno povečanje produktivnosti. Omogoča poenostavitev odpravljanja napak z zagotavljanjem popravkov na ravni stavkov in odstavkov z enim dotikom.

Tehnologija za lektoriranjem

Funkcijo lektoriranja sestavljajo štiri glavne komponente: proizvodnja podatkov, načrtovanje meritev, prilagajanje modela in serviranje modela. Vse te komponente skupaj zagotavljajo učinkovitost. Za zagotovitev, da je distribucija podatkov v skladu z domeno Gboard, sistem posnema pogoste napake tipkovnice z uporabo natančno in metodično zgrajene sintetične arhitekture napak.

Napredne meritve in optimizacija modela

Da bi ocenili model, so raziskovalci vključili številne metrike, s posebnim poudarkom na preverjanju prisotnosti slovničnih napak in podobnih preverjanjih pomena, ki izhajajo iz velikih jezikovnih modelov (LLM). Za izboljšanje modela se v tehniki InstructGPT uporabljata nadzorovano fino uravnavanje in uravnavanje s krepitvenim učenjem (RL). Učinkovitost lektoriranja modela se s tem postopkom močno izboljša.

Uvajanje in zmogljivost

Z uporabo 8-bitne kvantizacije je srednje velik LLM PaLM2-XS prilagojen, da se prilega enemu TPU v5 in služi kot osnova za funkcijo lektoriranja. Optimizacija zniža stroške strežbe. Predhodne raziskave so pokazale, da lahko segmentacija, špekulativno dekodiranje in ključi vedra zmanjšajo zakasnitev.

Vpliv v resničnem svetu

Na desettisoče uporabnikov Pixela 8 bo imelo koristi od visokokakovostnih urejanj, ki jih omogoča funkcija Proofread, ki je zdaj na voljo. Temeljito ustvarjanje sintetičnih podatkov in več iteracij natančnega prilagajanja je ustvarilo model, ki znatno zmanjša število slovničnih napak, kar je razvidno iz 5,74-odstotnega relativnega zmanjšanja razmerja Bad modela PaLM2-XS. Poleg tega so optimizacije povzročile 39,4-odstotno zmanjšanje mediane zakasnitve.

Obeti za prihodnost

Ta študija prikazuje, kako lahko LLM izboljšajo uporabniško izkušnjo in ustvarijo zanimive možnosti za nadaljnje preiskave. Uporaba podatkov resničnega uporabnika, večjezična podpora, prilagojena pomoč pri pisanju in rešitve za zasebnost naprav je nekaj primerov področij, ki bi lahko vodila k nadaljnjemu napredku v sektorju.

Google AI razširja možnosti tehnologije mobilne tipkovnice z uvedbo funkcije Proofread, ki izboljšuje tipkanje za ljudi po vsem svetu.