A Google mesterséges intelligencia bemutatja a „lektorálást”: a Gboard funkciót a mondat- és bekezdésjavításhoz

Frissítve a July 03, 2024 -en 3 percek olvasása

A Google AI a közelmúltban bevezetett egy új, „Proofread” nevű funkciót a Gboardon, a népszerű mobil billentyűzet alkalmazáson. Ez a funkció egyetlen érintéssel zökkenőmentes módosításokat és javításokat tesz lehetővé mondat- és bekezdésszinten, javítva az általános gépelési élményt.

A „kövér ujj” probléma kezelése

A Gboard statisztikai dekódolást használ a „kövér ujjak” problémájának megoldására, amely a kis képernyőkön az érintéses bevitel természetes pontatlansága. A kutatások azt mutatják, hogy a betűnkénti hibaarány dekódolás nélkül elérheti a 8-9 százalékot. A Gboard számos hibajavító funkcióval rendelkezik, amelyek megkönnyítik és gördülékenyebbé teszik a gépelést. Ezek a funkciók kombinálják az emberi közreműködést igénylő manuális feladatokat proaktív, automatizált korrekciókkal.

Átfogó hibajavító eszközök

A Gboard funkciói együttesen megkönnyítik a gépelést, beleértve a szókiegészítést, a következő szó előrejelzését, az aktív automatikus javítást (AC) és az aktív kulcsjavítást (KC). Ezek az eszközök közé tartozik az intelligens összeállítás, a hibajavítás és a többszavas jelöltek a javaslatsávban vagy soron belül. Az utólagos javítás (PC) a már elkövetett szavak hibáinak kijavítását is megkönnyíti. E funkciók ellenére két fő korlátozás rontja a felhasználói élményt.

Míg az olyan eszközön található javítási modellek, mint a KC, az AC és a PC, gyorsak és kompaktak, nehezen kezelik azokat a kifinomult és összetett hibákat, amelyek hosszabb kontextust igényelnek. A modellek aktiválásának megakadályozása érdekében a felhasználóknak lassan és pontosan kell gépelniük.
A gépelési sebesség csökken, mivel a felhasználóknak kézzel kell javítaniuk az elkötelezett szavakat nyelvtani és helyesírás-ellenőrző segítségével, ami mentálisan és vizuálisan megterhelő lehet.

Magas szintű hibajavítás szükségessége

A gyors gépelők gyakran figyelmen kívül hagyják a már beírt szavakat, és csak a billentyűzetre koncentrálnak. Emiatt magasabb hibaarány adódhat, amely mondatos vagy magasabb szintű korrekciós mechanizmusok alkalmazását teszi szükségessé.

Bemutatkozik a Proofread

A Proofread megoldja ezeket a gyakori panaszokat azáltal, hogy jelentős termelékenységnövekedést kínál. Egyszerűbbé teszi a hibajavítást azáltal, hogy egyérintéses mondat- és bekezdésszintű javításokat biztosít.

A lektorálás mögötti technológia

A Lektorálás funkció négy elsődleges összetevőből áll: adattermelés, mérőszámok tervezése, modellbeállítás és modellszolgáltatás. Mindezek az összetevők együttesen garantálják a hatékonyságot. Annak biztosítása érdekében, hogy az adatok elosztása összhangban legyen a Gboard tartományával, a rendszer precízen és módszeresen felépített hibaszintetikus architektúrával utánozza a gyakori billentyűzethibákat.

Speciális mutatók és modelloptimalizálás

A modell értékeléséhez a kutatók számos mérőszámot beépítettek, különös hangsúlyt fektetve a nyelvtani hibák jelenlétének ellenőrzésére és a nagy nyelvi modellekből (LLM) származó hasonló jelentésellenőrzésekre. Az InstructGPT technikában a felügyelt finomhangolást és a megerősítési tanulási (RL) hangolást használják a modell javítására. Ez az eljárás nagymértékben javítja a modell lektorálási teljesítményét.

Üzembe helyezés és teljesítmény

A 8 bites kvantálást használó, közepes méretű LLM PaLM2-XS-t úgy alakították ki, hogy egyetlen TPU v5-be illeszkedjen, és ez szolgálja a Proofread funkció alapját. Az optimalizálás csökkenti a kiszolgálás költségeit. Korábbi kutatások kimutatták, hogy a szegmentálás, a spekulatív dekódolás és a gyűjtőkulcsok csökkenthetik a késleltetést.

Valós hatás

A Pixel 8 felhasználók tízezrei profitálnak majd a már elérhető Lektorálás funkció által biztosított kiváló minőségű szerkesztésekből. A szintetikus adatok alapos generálása és a finomhangolás számos iterációja olyan modellt hozott létre, amely jelentősen csökkenti a nyelvtani hibákat, amint azt a PaLM2-XS modell Bad arányának 5,74 százalékos relatív csökkenése is mutatja. Ezenkívül az optimalizálás a medián késleltetés 39,4%-os csökkenését eredményezte.

Kilátások a jövőre

Ez a tanulmány bemutatja, hogy az LLM-ek hogyan javíthatják a felhasználói élményt, és érdekes lehetőségeket teremthetnek a további vizsgálatokhoz. A valós felhasználói adatok használata, a többnyelvű támogatás, a személyre szabott írási segítségnyújtás és az eszközök adatvédelmi megoldásai néhány példa azokra a területekre, amelyek további fejlődéshez vezethetnek az ágazatban.

A Google mesterséges intelligencia a Proofread funkció bevezetésével bővíti a mobil billentyűzet technológia lehetőségeit, javítva a gépelést a világ minden táján.