A Google AI a közelmúltban bevezetett egy új, „Proofread” nevű funkciót a Gboardon, a népszerű mobil billentyűzet alkalmazáson. Ez a funkció egyetlen érintéssel zökkenőmentes módosításokat és javításokat tesz lehetővé mondat- és bekezdésszinten, javítva az általános gépelési élményt.
A „kövér ujj” probléma kezelése
A Gboard statisztikai dekódolást használ a „kövér ujjak” problémájának megoldására, amely a kis képernyőkön az érintéses bevitel természetes pontatlansága. A kutatások azt mutatják, hogy a betűnkénti hibaarány dekódolás nélkül elérheti a 8-9 százalékot. A Gboard számos hibajavító funkcióval rendelkezik, amelyek megkönnyítik és gördülékenyebbé teszik a gépelést. Ezek a funkciók kombinálják az emberi közreműködést igénylő manuális feladatokat proaktív, automatizált korrekciókkal.
Átfogó hibajavító eszközök
A Gboard funkciói együttesen megkönnyítik a gépelést, beleértve a szókiegészítést, a következő szó előrejelzését, az aktív automatikus javítást (AC) és az aktív kulcsjavítást (KC). Ezek az eszközök közé tartozik az intelligens összeállítás, a hibajavítás és a többszavas jelöltek a javaslatsávban vagy soron belül. Az utólagos javítás (PC) a már elkövetett szavak hibáinak kijavítását is megkönnyíti. E funkciók ellenére két fő korlátozás rontja a felhasználói élményt.
-
Míg az olyan eszközön található javítási modellek, mint a KC, az AC és a PC, gyorsak és kompaktak, nehezen kezelik azokat a kifinomult és összetett hibákat, amelyek hosszabb kontextust igényelnek. A modellek aktiválásának megakadályozása érdekében a felhasználóknak lassan és pontosan kell gépelniük.
-
A gépelési sebesség csökken, mivel a felhasználóknak kézzel kell javítaniuk az elkötelezett szavakat nyelvtani és helyesírás-ellenőrző segítségével, ami mentálisan és vizuálisan megterhelő lehet.
Magas szintű hibajavítás szükségessége
A gyors gépelők gyakran figyelmen kívül hagyják a már beírt szavakat, és csak a billentyűzetre koncentrálnak. Emiatt magasabb hibaarány adódhat, amely mondatos vagy magasabb szintű korrekciós mechanizmusok alkalmazását teszi szükségessé.
Bemutatkozik a Proofread
A Proofread megoldja ezeket a gyakori panaszokat azáltal, hogy jelentős termelékenységnövekedést kínál. Egyszerűbbé teszi a hibajavítást azáltal, hogy egyérintéses mondat- és bekezdésszintű javításokat biztosít.
A lektorálás mögötti technológia
A Lektorálás funkció négy elsődleges összetevőből áll: adattermelés, mérőszámok tervezése, modellbeállítás és modellszolgáltatás. Mindezek az összetevők együttesen garantálják a hatékonyságot. Annak biztosítása érdekében, hogy az adatok elosztása összhangban legyen a Gboard tartományával, a rendszer precízen és módszeresen felépített hibaszintetikus architektúrával utánozza a gyakori billentyűzethibákat.
Speciális mutatók és modelloptimalizálás
A modell értékeléséhez a kutatók számos mérőszámot beépítettek, különös hangsúlyt fektetve a nyelvtani hibák jelenlétének ellenőrzésére és a nagy nyelvi modellekből (LLM) származó hasonló jelentésellenőrzésekre. Az InstructGPT technikában a felügyelt finomhangolást és a megerősítési tanulási (RL) hangolást használják a modell javítására. Ez az eljárás nagymértékben javítja a modell lektorálási teljesítményét.
Üzembe helyezés és teljesítmény
A 8 bites kvantálást használó, közepes méretű LLM PaLM2-XS-t úgy alakították ki, hogy egyetlen TPU v5-be illeszkedjen, és ez szolgálja a Proofread funkció alapját. Az optimalizálás csökkenti a kiszolgálás költségeit. Korábbi kutatások kimutatták, hogy a szegmentálás, a spekulatív dekódolás és a gyűjtőkulcsok csökkenthetik a késleltetést.
Valós hatás
A Pixel 8 felhasználók tízezrei profitálnak majd a már elérhető Lektorálás funkció által biztosított kiváló minőségű szerkesztésekből. A szintetikus adatok alapos generálása és a finomhangolás számos iterációja olyan modellt hozott létre, amely jelentősen csökkenti a nyelvtani hibákat, amint azt a PaLM2-XS modell Bad arányának 5,74 százalékos relatív csökkenése is mutatja. Ezenkívül az optimalizálás a medián késleltetés 39,4%-os csökkenését eredményezte.
Kilátások a jövőre
Ez a tanulmány bemutatja, hogy az LLM-ek hogyan javíthatják a felhasználói élményt, és érdekes lehetőségeket teremthetnek a további vizsgálatokhoz. A valós felhasználói adatok használata, a többnyelvű támogatás, a személyre szabott írási segítségnyújtás és az eszközök adatvédelmi megoldásai néhány példa azokra a területekre, amelyek további fejlődéshez vezethetnek az ágazatban.
A Google mesterséges intelligencia a Proofread funkció bevezetésével bővíti a mobil billentyűzet technológia lehetőségeit, javítva a gépelést a világ minden táján.