„Google AI“ pristato „korektūros skaitymą“: „Gboard“ funkciją, leidžiančią lengvai taisyti sakinius ir pastraipas

„Google AI“ pristato „korektūros skaitymą“: „Gboard“ funkciją, leidžiančią lengvai taisyti sakinius ir pastraipas

Google AI neseniai pristatė naują „Gboard“ – populiarios mobiliosios klaviatūros programos – funkciją. Vienu bakstelėjimu ši funkcija leidžia sklandžiai modifikuoti ir taisyti sakinio ir pastraipos lygiu, o tai pagerina bendrą spausdinimo patirtį.

„riebaus piršto“ problemos sprendimas

Gboard naudoja statistinį dekodavimą kaip priemonę „riebaus piršto“ problemai spręsti, kuri yra natūralus jutiklinio įvesties netikslumas mažuose ekranuose. Tyrimai rodo, kad klaidų dažnis vienoje raidėje gali siekti 8–9 procentus be dekodavimo. „Gboard“ turi keletą klaidų taisymo funkcijų, kad būtų lengviau ir sklandžiau vesti tekstą. Šios funkcijos sujungia rankines užduotis, susijusias su žmogaus indėliu, su aktyviomis automatizuotomis pataisomis.

Išsamūs klaidų taisymo įrankiai

Bendrai įvesti tekstą palengvina „Gboard“ funkcijos, įskaitant žodžių užbaigimą, kito žodžio numatymą, aktyvų automatinį taisymą (AC) ir aktyvųjį klavišo taisymą (KC). Šie įrankiai apima protingą kompoziciją, klaidų taisymą ir kelių žodžių kandidatus pasiūlymų juostoje arba eilutėje. Postkorekcija (PC) taip pat palengvina jau padarytų žodžių klaidų ištaisymą. Nepaisant šių funkcijų, du pagrindiniai apribojimai pablogina vartotojo patirtį.

  1. Nors įrenginyje esantys taisymo modeliai, tokie kaip KC, AC ir PC, yra greiti ir kompaktiški, jiems sunku tvarkyti sudėtingas ir sudėtingas klaidas, kurioms reikia ilgesnių kontekstų. Kad šie modeliai nebūtų suaktyvinti, vartotojai turi rašyti lėtai ir tiksliai.

  2. Rašymo greitis sumažėja, nes naudotojai turi rankiniu būdu taisyti įsipareigotus žodžius naudodami gramatiką ir rašybos tikrinimo priemones, o tai gali būti psichiškai ir vizualiai sudėtinga.

Aukšto lygio klaidų taisymo poreikis

Greitai spausdinantieji dažnai nepaiso jau įvestų žodžių ir koncentruojasi tik į klaviatūrą. Dėl to gali atsirasti didesnis klaidų lygis, todėl reikia naudoti sakinius arba aukštesnio lygio taisymo mechanizmus.

Pristatome Proofread

Korektūra išsprendžia šiuos dažnus skundus, pasiūlydama pastebimą produktyvumo padidėjimą. Tai palengvina klaidų taisymą, nes vienu spustelėjimu galima taisyti sakinio ir pastraipos lygiu.

Korektūros technologija

Korektūros funkciją sudaro keturi pagrindiniai komponentai: duomenų kūrimas, metrikos projektavimas, modelio koregavimas ir modelio aptarnavimas. Visi šie komponentai kartu garantuoja efektyvumą. Siekdama užtikrinti, kad duomenų paskirstymas atitiktų Gboard domeną, sistema imituoja dažnas klaviatūros klaidas, naudodama tiksliai ir metodiškai sukurtą klaidų sintetinę architektūrą.

Išplėstinė metrika ir modelio optimizavimas

Norėdami įvertinti modelį, mokslininkai įtraukė daugybę metrikų, ypatingą dėmesį skirdami gramatinių klaidų buvimo patikrinimams ir panašiems reikšmių patikrinimams, gautiems iš didelių kalbos modelių (LLM). Modeliui tobulinti InstructGPT technikoje naudojamas prižiūrimas koregavimas ir mokymosi sustiprinimo (RL) derinimas. Ši procedūra labai pagerina modelio korektūros našumą.

Diegimas ir našumas

Naudojant 8 bitų kvantavimą, vidutinio dydžio LLM PaLM2-XS yra pritaikytas taip, kad tilptų į vieną TPU v5 ir yra korektūros funkcijos pagrindas. Optimizavimas sumažina aptarnavimo išlaidas. Ankstesni tyrimai parodė, kad segmentavimas, spekuliacinis dekodavimas ir segmento klavišai gali sumažinti delsą.

Realaus pasaulio poveikis

Dešimtys tūkstančių „Pixel 8“ vartotojų gaus naudos iš aukštos kokybės redagavimo, kurį teikia korektūros funkcija, kuri dabar pasiekiama. Kruopštus sintetinių duomenų generavimas ir kelios tikslaus derinimo iteracijos sukūrė modelį, kuris žymiai sumažina gramatines klaidas, kaip matyti iš 5,74 procento santykinio PaLM2-XS modelio blogo koeficiento sumažėjimo. Be to, dėl optimizavimo vidutinis delsos laikas sumažėjo 39,4 %.

Ateities perspektyvos

Šis tyrimas parodo, kaip LLM gali pagerinti naudotojų patirtį ir sukurti intriguojančių tolesnio tyrimo galimybių. Tikrųjų naudotojų duomenų naudojimas, daugiakalbis palaikymas, pritaikyta rašymo pagalba ir įrenginio privatumo sprendimai yra keletas sričių, kurios gali paskatinti tolesnę pažangą šiame sektoriuje, pavyzdžiai.

„Google AI“ plečia mobiliosios klaviatūros technologijos galimybes įdiegdama korektūros funkciją, gerindama spausdinimą žmonėms visame pasaulyje.

Code Labs Academy © 2024 Visos teisės saugomos.