Google AI avduker 'korrekturlesing': Gboard-funksjon for uanstrengt rettelser av setninger og avsnitt

Oppdatert på June 13, 2024 3 minutter lest

Google AI introduserte nylig en ny funksjon kalt «korrekturlesing» til Gboard, den populære applikasjonen for mobiltastatur. Med ett enkelt trykk tillater denne funksjonen sømløse modifikasjoner og korrigeringer på setnings- og avsnittsnivå, og forbedrer den generelle skriveopplevelsen.

Løsning av “Fat Finger”-problemet

Gboard bruker statistisk dekoding som et middel til å løse problemet med «feit finger», som er den naturlige unøyaktigheten av berøringsinndata på små skjermer. Forskning viser at feilraten per bokstav kan nå 8 til 9 prosent uten dekoding. Gboard kommer med flere feilrettingsfunksjoner for å gjøre skrivingen enklere og smidigere. Disse funksjonene kombinerer manuelle oppgaver som involverer menneskelig input med proaktive, automatiserte korrigeringer.

Omfattende feilrettingsverktøy

Skriving gjøres kollektivt enklere av Gboards funksjoner, som inkluderer fullføring av ord, prediksjoner for neste ord, aktiv automatisk korrigering (AC) og aktiv nøkkelkorrigering (KC). Disse verktøyene inkluderer smart komposisjon, feilretting og kandidater med flere ord i forslagslinjen eller inline. Etterretting (PC) letter også retting av feil i ord som allerede er begått. Til tross for disse funksjonene, svekker to viktige begrensninger brukeropplevelsen.

Mens korrigeringsmodeller på enheten som KC, AC og PC er raske og kompakte, har de problemer med å håndtere sofistikerte og komplekse feil som trenger lengre sammenhenger. For å forhindre at disse modellene aktiveres, må brukerne skrive sakte og presist.
Skrivehastigheten reduseres som følge av at brukere må manuelt korrigere forpliktede ord ved hjelp av grammatikk og stavekontroll, noe som kan være mentalt og visuelt belastende.

Behovet for feilretting på høyt nivå

Raske typer ser ofte bort fra ord de allerede har skrevet og konsentrerer seg bare om tastaturet. Høyere feilrater kan oppstå som følge av dette, noe som nødvendiggjør bruk av setninger eller korrigeringsmekanismer på høyere nivå.

Vi introduserer Korrekturlesing

Korrekturlesing løser disse hyppige klagene ved å tilby bemerkelsesverdige produktivitetsøkninger. Det gjør feilretting enklere ved å gi rettelser på setnings- og avsnittsnivå med ett trykk.

Teknologien bak korrekturlesing

Korrekturlesingsfunksjonen består av fire hovedkomponenter: dataproduksjon, metrikkdesign, modelljustering og modellvisning. Sammen garanterer alle disse komponentene effektivitet. For å sikre at datadistribusjonen er i tråd med Gboard-domenet, etterligner systemet hyppige tastaturfeil ved å bruke en nøyaktig og metodisk bygget feilsyntetisk arkitektur.

Avanserte beregninger og modelloptimalisering

For å vurdere modellen har forskerne inkorporert en rekke beregninger, med særlig vekt på tilstedeværelseskontroller av grammatiske feil og lignende meningssjekker avledet fra store språkmodeller (LLM). Overvåket finjustering og Reinforcement Learning (RL) tuning brukes i InstructGPT-teknikken for å forbedre modellen. Modellens korrekturlesing er betraktelig forbedret med denne prosedyren.

Implementering og ytelse

Ved å bruke 8-bits kvantisering er den mellomstore LLM PaLM2-XS skreddersydd for å passe inn i en enkelt TPU v5 og fungerer som grunnlaget for korrekturlesingsfunksjonen. Optimaliseringen reduserer kostnadene ved servering. Tidligere forskning har vist at segmentering, spekulativ dekoding og bøttenøkler kan redusere ventetiden.

Virkelighet i verden

Titusenvis av Pixel 8-brukere vil dra nytte av høykvalitetsredigeringene fra korrekturlesingsfunksjonen, som nå er tilgjengelig. En grundig generering av syntetiske data og flere gjentakelser av finjustering har produsert en modell som reduserer grammatiske feil betydelig, sett av en 5,74 prosent relativ reduksjon i PaLM2-XS-modellens dårlige forhold. I tillegg har optimaliseringer resultert i en reduksjon på 39,4 % i median latenstid.

Framtidige mål

Denne studien viser hvordan LLM-er kan forbedre brukeropplevelsen og skape spennende muligheter for videre undersøkelser. Bruken av reelle brukerdata, flerspråklig støtte, skreddersydd skrivehjelp og personvernløsninger for enheter er noen eksempler på områder som kan føre til ytterligere fremskritt i sektoren.

Google AI utvider mulighetene for mobiltastaturteknologi med introduksjonen av Korrekturlesing-funksjonen, og forbedrer skrivingen for folk over hele verden.