Umělá inteligence Google nedávno představila novou funkci nazvanou „Proofread“ do Gboard, populární aplikace pro mobilní klávesnici. Jediným klepnutím tato funkce umožňuje bezproblémové úpravy a opravy na úrovni vět a odstavců, což zlepšuje celkový zážitek z psaní.
Řešení problému „tlustého prstu“.
Gboard používá statistické dekódování jako prostředek k řešení problému „tlustého prstu“, což je přirozená nepřesnost dotykového vstupu na malých obrazovkách. Výzkum ukazuje, že chybovost na písmeno může dosáhnout 8 až 9 procent bez dekódování. Gboard je vybaven několika funkcemi pro opravu chyb, které usnadňují a zrychlují psaní. Tyto funkce kombinují manuální úkoly zahrnující lidský vstup s proaktivními automatickými opravami.
Komplexní nástroje pro opravu chyb
Psaní společně usnadňují funkce Gboardu, které zahrnují dokončování slov, předvídání dalšího slova, aktivní automatickou opravu (AC) a aktivní opravu kláves (KC). Tyto nástroje zahrnují inteligentní kompozici, opravu chyb a víceslovné kandidáty na panelu návrhů nebo v řádku. Dodatečná korekce (PC) také usnadňuje opravu chyb ve slovech, které již byly spáchány. Navzdory těmto funkcím narušují uživatelskou zkušenost dvě klíčová omezení.
-
Zatímco modely korekce na zařízení, jako jsou KC, AC a PC, jsou rychlé a kompaktní, mají potíže se zpracováním sofistikovaných a složitých chyb, které vyžadují delší kontext. Aby se zabránilo aktivaci těchto modelů, musí uživatelé psát pomalu a přesně.
-
Rychlost psaní se snižuje v důsledku toho, že uživatelé musí ručně opravovat potvrzená slova pomocí kontroly gramatiky a pravopisu, což může být psychicky i vizuálně náročné.
Potřeba opravy chyb na vysoké úrovni
Rychlopisáři často ignorují slova, která již napsali, a soustředí se pouze na klávesnici. Z toho může vzniknout vyšší chybovost, což si vyžádá použití trestu nebo opravných mechanismů vyšší úrovně.
Představujeme korekturu
Korektura řeší tyto časté stížnosti tím, že nabízí výrazné zvýšení produktivity. Usnadňuje opravu chyb tím, že poskytuje opravy na úrovni vět a odstavců jedním klepnutím.
Technologie za korekturou
Funkce Proofread se skládá ze čtyř primárních komponent: produkce dat, návrh metrik, ladění modelu a poskytování modelu. Všechny tyto složky dohromady zaručují účinnost. Aby bylo zajištěno, že distribuce dat bude v souladu s doménou Gboard, systém napodobuje časté chyby klávesnice pomocí přesně a metodicky sestavené syntetické architektury chyb.
Pokročilé metriky a optimalizace modelu
Za účelem posouzení modelu začlenili výzkumníci řadu metrik se zvláštním důrazem na kontroly přítomnosti gramatických chyb a podobné kontroly významu odvozené z velkých jazykových modelů (LLM). K vylepšení modelu se v technice InstructGPT používá supervizované jemné ladění a ladění Reinforcement Learning (RL). Výkonnost korektur modelu je tímto postupem výrazně zlepšena.
Nasazení a výkon
Pomocí 8bitové kvantizace je středně velký LLM PaLM2-XS přizpůsoben tak, aby se vešel do jediného TPU v5 a slouží jako základ pro funkci Proofread. Optimalizace snižuje náklady na obsluhu. Dřívější výzkum ukázal, že segmentace, spekulativní dekódování a bucket klíče mohou snížit latenci.
Dopad na skutečný svět
Desítky tisíc uživatelů Pixel 8 budou profitovat z vysoce kvalitních úprav, které poskytuje funkce Proofread, která je nyní k dispozici. Důkladné generování syntetických dat a několik iterací jemného ladění vytvořilo model, který podstatně snižuje gramatické chyby, jak je vidět na relativním snížení špatného poměru modelu PaLM2-XS o 5,74 procenta. Optimalizace navíc vedly ke snížení střední latence o 39,4 %.
Budoucí prospekty
Tato studie ukazuje, jak mohou LLM zlepšit uživatelský dojem a vytvořit zajímavé možnosti pro další zkoumání. Použití dat skutečných uživatelů, vícejazyčná podpora, přizpůsobená pomoc při psaní a řešení ochrany osobních údajů zařízení jsou několika příklady oblastí, které by mohly vést k dalšímu pokroku v tomto odvětví.
Umělá inteligence Google rozšiřuje možnosti technologie mobilní klávesnice zavedením funkce Proofread, která zlepšuje psaní pro lidi na celém světě.