Google AI julkistaa 'Oikoluetun': Gboard-ominaisuuden vaivattomaan lauseen ja kappaleen korjaukseen

Päivitetty June 24, 2024 3 minuutteja luetaan

Google AI esitteli äskettäin uuden Oikilukemisen ominaisuuden Gboardiin, suosittuun mobiilinäppäimistösovellukseen. Yhdellä napautuksella tämä ominaisuus mahdollistaa saumattomat muutokset ja korjaukset lause- ja kappaletasolla, mikä parantaa yleistä kirjoituskokemusta.

”Fat Finger” -ongelman ratkaiseminen

Gboard käyttää tilastollista dekoodausta keinona ratkaista “rasvasormi”-ongelma, joka on pienillä näytöillä esiintyvä kosketussyötteen luonnollinen epätarkkuus. Tutkimukset osoittavat, että virheprosentti kirjettä kohti voi olla 8–9 prosenttia ilman dekoodausta. Gboardissa on useita virheenkorjausominaisuuksia, jotka tekevät kirjoittamisesta helpompaa ja sujuvampaa. Nämä ominaisuudet yhdistävät manuaaliset tehtävät, joihin liittyy ihmisen panos, ennakoiviin, automaattisiin korjauksiin.

Kattavat virheenkorjaustyökalut

Gboardin ominaisuudet, kuten sanan täydennys, seuraavan sanan ennustaminen, aktiivinen automaattinen korjaus (AC) ja aktiivinen avainkorjaus (KC), tekevät kirjoittamisesta helpompaa. Näitä työkaluja ovat älykäs kokoonpano, virheenkorjaus ja usean sanan ehdokkaat ehdotuspalkissa tai tekstin sisällä. Post-korjaus (PC) helpottaa myös jo tehtyjen sanojen virheiden korjaamista. Näistä ominaisuuksista huolimatta kaksi keskeistä rajoitusta heikentävät käyttökokemusta.

Vaikka laitteessa olevat korjausmallit, kuten KC, AC ja PC, ovat nopeita ja kompakteja, niillä on vaikeuksia käsitellä kehittyneitä ja monimutkaisia virheitä, jotka vaativat pidempiä yhteyksiä. Jotta nämä mallit eivät aktivoituisi, käyttäjien on kirjoitettava hitaasti ja tarkasti.
Kirjoitusnopeus laskee, koska käyttäjien on korjattava sitoutuneita sanoja manuaalisesti kieliopin ja oikeinkirjoituksen tarkistusten avulla, mikä voi olla henkisesti ja visuaalisesti raskasta.

Korkean tason virheenkorjauksen tarve

Nopeat kirjoittajat jättävät usein huomiotta jo kirjoittamansa sanat ja keskittyvät vain näppäimistöön. Tästä voi aiheutua suurempia virhemääriä, mikä edellyttää lauseen tai korkeamman tason korjausmekanismeja.

Esittelyssä Proofread

Oikoluku ratkaisee nämä usein esiintyvät valitukset tarjoamalla huomattavia tuottavuuden lisäyksiä. Se tekee virheiden korjaamisesta yksinkertaisempaa tarjoamalla yhden kosketuksen lause- ja kappaletason korjauksia.

Oikolukujen takana oleva tekniikka

Oikoluku-ominaisuus koostuu neljästä pääkomponentista: tiedon tuottamisesta, mittareiden suunnittelusta, mallin säätämisestä ja mallin tarjoamisesta. Kaikki nämä komponentit yhdessä takaavat tehokkuuden. Varmistaakseen, että tietojen jakelu on linjassa Gboard-verkkotunnuksen kanssa, järjestelmä jäljittelee toistuvia näppäimistövirheitä käyttämällä tarkasti ja menetelmällisesti rakennettua virhesynteettistä arkkitehtuuria.

Kehittyneet mittarit ja mallin optimointi

Mallin arvioimiseksi tutkijat ovat ottaneet käyttöön useita mittareita painottaen erityisesti kielioppivirheiden olemassaolotarkistuksia ja vastaavia suurista kielimalleista (LLM) johdettuja merkitystarkistuksia. Valvottua hienosäätöä ja vahvistusoppimisen (RL) viritystä käytetään InstructGPT-tekniikassa mallin parantamiseksi. Tämä menettely parantaa mallin oikolukemista huomattavasti.

Käyttöönotto ja suorituskyky

8-bittistä kvantisointia käyttämällä keskikokoinen LLM PaLM2-XS on räätälöity sopimaan yhteen TPU v5:een ja toimii oikolukuominaisuuden perustana. Optimointi alentaa palvelun kustannuksia. Aiemmat tutkimukset ovat osoittaneet, että segmentointi, spekulatiivinen dekoodaus ja bucket-avaimet voivat vähentää latenssia.

Reaalimaailman vaikutus

Kymmenet tuhannet Pixel 8 -käyttäjät hyötyvät nyt saatavilla olevan oikolukuominaisuuden tarjoamista korkealaatuisista muokkauksista. Perusteellinen synteettisen datan sukupolvi ja useat hienosäädön iteraatiot ovat tuottaneet mallin, joka vähentää merkittävästi kielioppivirheitä, mikä näkyy PaLM2-XS-mallin Bad-suhteen suhteellisessa laskussa 5,74 prosenttia. Lisäksi optimoinnit ovat johtaneet 39,4 %:n laskuun mediaanilatenssissa.

Tulevaisuuden näkymät

Tämä tutkimus osoittaa, kuinka LLM:t voivat parantaa käyttökokemusta ja luoda kiehtovia mahdollisuuksia lisätutkimukselle. Todellisten käyttäjätietojen käyttö, monikielinen tuki, räätälöity kirjoitusapu ja laitteiden yksityisyysratkaisut ovat muutamia esimerkkejä alueista, jotka voivat johtaa alan edistymiseen.

Google AI laajentaa mobiilinäppäimistötekniikan mahdollisuuksia ottamalla käyttöön oikolukuominaisuuden, joka parantaa kirjoittamista kaikkialla maailmassa.