Google AI a introdus recent o nouă funcție numită „Corectare” în Gboard, populara aplicație de tastatură mobilă. Cu o singură atingere, această caracteristică permite modificări și corecții fără întreruperi la nivel de propoziție și paragraf, îmbunătățind experiența generală de tastare.
Abordarea problemei „degetului gras”.
Gboard folosește decodificarea statistică ca mijloc de a rezolva problema „degetului gras”, care este inexactitatea naturală a introducerii tactile pe ecranele mici. Cercetările arată că rata de eroare pe literă poate ajunge la 8 până la 9 procente fără decodare. Gboard vine cu mai multe funcții de corectare a erorilor pentru a face tastarea mai ușoară și mai fluidă. Aceste caracteristici combină sarcini manuale care implică aport uman cu corecții proactive și automate.
Instrumente cuprinzătoare de corectare a erorilor
Tastarea este simplificată în mod colectiv de funcțiile Gboard, care includ completarea cuvintelor, predicțiile pentru cuvântul următor, corecția automată activă (AC) și corecția cu tastele active (KC). Aceste instrumente includ compoziția inteligentă, corectarea erorilor și candidați cu mai multe cuvinte în bara de sugestii sau în linie. Post-corecția (PC) facilitează, de asemenea, rectificarea erorilor în cuvintele care au fost deja comise. În ciuda acestor caracteristici, două restricții cheie afectează experiența utilizatorului.
-
În timp ce modelele de corecție pe dispozitiv, cum ar fi KC, AC și PC sunt rapide și compacte, întâmpină dificultăți în gestionarea erorilor sofisticate și complexe care necesită contexte mai lungi. Pentru a preveni activarea acestor modele, utilizatorii trebuie să tasteze încet și precis.
-
Viteza de tastare scade ca urmare a faptului că utilizatorii trebuie să corecteze manual cuvintele comise folosind verificatoare de gramatică și ortografie, care pot fi dificile din punct de vedere mental și vizual.
Nevoia de corectare a erorilor la nivel înalt
Cei care dactilografiază rapid ignoră frecvent cuvintele pe care le-au tastat deja și se concentrează doar pe tastatură. Din aceasta pot apărea rate de eroare mai mari, necesitând folosirea unor mecanisme de corecție de nivel superior.
Vă prezentăm Corectarea
Verificarea corectă rezolvă aceste reclamații frecvente, oferind creșteri notabile de productivitate. Face corectarea erorilor mai simplă, oferind corecții la nivel de propoziție și paragraf cu o singură atingere.
Tehnologia din spatele corecturii
Funcția de corectare este alcătuită din patru componente principale: producția de date, proiectarea valorilor, modificarea modelului și difuzarea modelelor. Împreună, toate aceste componente garantează eficacitatea. Pentru a se asigura că distribuția datelor este în conformitate cu domeniul Gboard, sistemul imită erorile frecvente de la tastatură folosind o arhitectură sintetică a erorilor construită cu precizie și metodic.
Valori avansate și optimizare a modelelor
Pentru a evalua modelul, cercetătorii au încorporat o serie de metrici, cu un accent deosebit pe verificările prezenței erorilor gramaticale și verificările de semnificație similară derivate din modelele de limbaj mari (LLM). Reglajul fin supravegheat și reglarea învățării prin întărire (RL) sunt utilizate în tehnica InstructGPT pentru a îmbunătăți modelul. Performanța de corectare a modelului este mult îmbunătățită prin această procedură.
Implementare și performanță
Folosind cuantizarea pe 8 biți, LLM PaLM2-XS de dimensiuni medii este adaptat pentru a se potrivi într-un singur TPU v5 și servește drept bază pentru funcția de corectare. Optimizarea reduce costul de servire. Cercetările anterioare au demonstrat că segmentarea, decodificarea speculativă și cheile bucket pot reduce latența.
Impact în lumea reală
Zeci de mii de utilizatori Pixel 8 vor beneficia de editările de înaltă calitate oferite de funcția de corectare, care este acum disponibilă. O generare amănunțită de date sintetice și mai multe iterații de reglare fină au produs un model care reduce substanțial erorile gramaticale, așa cum se vede printr-o scădere relativă de 5,74% a raportului Bad al modelului PaLM2-XS. În plus, optimizările au dus la o scădere cu 39,4% a latenței medii.
Perspective de viitor
Acest studiu demonstrează modul în care LLM-urile pot îmbunătăți experiența utilizatorului și pot crea posibilități interesante pentru investigații suplimentare. Utilizarea datelor utilizatorilor reali, asistența multilingvă, asistența personalizată pentru scriere și soluțiile de confidențialitate ale dispozitivelor sunt câteva exemple de domenii care ar putea duce la progrese suplimentare în sector.
Google AI extinde posibilitățile tehnologiei tastaturii mobile prin introducerea funcției de corectare, îmbunătățind tastarea pentru oameni din întreaga lume.