Google AI нядаўна прадставіў новую функцыю пад назвай "Прачытанне" ў Gboard, папулярнай мабільнай клавіятурнай праграме. Адным націскам гэтая функцыя дазваляе ўносіць плаўныя мадыфікацыі і выпраўленні на ўзроўні сказа і абзаца, паляпшаючы агульны досвед уводу.
Рашэнне праблемы "тоўстага пальца".
Gboard выкарыстоўвае статыстычнае дэкадаванне як сродак вырашэння праблемы "тоўстага пальца", якая з'яўляецца натуральнай недакладнасцю сэнсарнага ўводу на маленькіх экранах. Даследаванні паказваюць, што ўзровень памылак на літару можа дасягаць ад 8 да 9 працэнтаў без дэкадавання. Gboard пастаўляецца з некалькімі функцыямі выпраўлення памылак, каб зрабіць увод прасцейшым і плыўным. Гэтыя функцыі спалучаюць ручныя задачы з удзелам чалавека з актыўнымі аўтаматычнымі выпраўленнямі.
Комплексныя інструменты выпраўлення памылак
Увод тэксту палягчаецца разам дзякуючы функцыям Gboard, якія ўключаюць завяршэнне слоў, прагназаванне наступнага слова, актыўную аўтакарэкцыю (AC) і актыўную карэкцыю клавіш (KC). Гэтыя інструменты ўключаюць у сябе разумную кампазіцыю, выпраўленне памылак і некалькі слоў-кандыдатаў у панэлі прапаноў або ў радку. Поствыпраўленне (ПК) таксама спрыяе выпраўленню памылак у словах, якія ўжо былі зроблены. Нягледзячы на гэтыя асаблівасці, два асноўныя абмежаванні пагаршаюць карыстацкі досвед.
-
У той час як мадэлі карэкцыі на прыладзе, такія як KC, AC і PC, хуткія і кампактныя, яны маюць цяжкасці з апрацоўкай складаных і складаных памылак, якія патрабуюць больш працяглых кантэкстаў. Каб гэтыя мадэлі не актываваліся, карыстальнікі павінны ўводзіць павольна і дакладна.
-
Хуткасць набору тэксту зніжаецца ў выніку таго, што карыстальнікам даводзіцца ўручную выпраўляць замацаваныя словы з дапамогай граматыкі і праверкі арфаграфіі, што можа нагружаць розум і зрок.
Патрэба ў выпраўленні памылак высокага ўзроўню
Людзі, якія хутка друкуюць, часта ігнаруюць словы, якія яны ўжо набралі, і засяроджваюцца толькі на клавіятуры. З-за гэтага можа паўстаць больш высокі ўзровень памылак, што патрабуе выкарыстання механізмаў карэкцыі прысуду або больш высокага ўзроўню.
Прадстаўляем карэктуру
Карэктура вырашае гэтыя частыя скаргі, прапаноўваючы значнае павышэнне прадукцыйнасці. Гэта спрашчае выпраўленне памылак, забяспечваючы выпраўленні на ўзроўні прапаноў і абзацаў адным націскам.
Тэхналогія карэктуры
Функцыя Proofread складаецца з чатырох асноўных кампанентаў: вытворчасць даных, распрацоўка паказчыкаў, налада мадэлі і абслугоўванне мадэлі. У сукупнасці ўсе гэтыя кампаненты гарантуюць эфектыўнасць. Каб забяспечыць размеркаванне даных у адпаведнасці з даменам Gboard, сістэма імітуе частыя памылкі клавіятуры, выкарыстоўваючы дакладна і метадычна пабудаваную сінтэтычную архітэктуру памылак.
Пашыраныя паказчыкі і аптымізацыя мадэлі
Каб ацаніць мадэль, даследчыкі ўключылі шэраг паказчыкаў, з асаблівым акцэнтам на праверцы наяўнасці граматычных памылак і падобных праверках значэнняў, атрыманых з вялікіх моўных мадэляў (LLM). Для паляпшэння мадэлі ў тэхніцы InstructGPT выкарыстоўваюцца кантраляваная тонкая налада і налада навучання з падмацаваннем (RL). Гэтая працэдура значна паляпшае прадукцыйнасць карэктуры мадэлі.
Разгортванне і прадукцыйнасць
Выкарыстоўваючы 8-бітнае квантаванне, LLM PaLM2-XS сярэдняга памеру прыстасаваны для размяшчэння ўнутры аднаго TPU v5 і служыць асновай для функцыі праверкі. Аптымізацыя зніжае кошт абслугоўвання. Папярэднія даследаванні прадэманстравалі, што сегментацыя, спекулятыўнае дэкадаванне і ключы-вядры могуць паменшыць затрымку.
Уплыў у рэальным свеце
Дзясяткі тысяч карыстальнікаў Pixel 8 атрымаюць прыбытак ад высакаякасных правак, якія забяспечвае функцыя «Прачытка», якая цяпер даступная. Дбайная генерацыя сінтэтычных даных і некалькі ітэрацый тонкай налады стварылі мадэль, якая істотна зніжае колькасць граматычных памылак, пра што сведчыць адноснае зніжэнне каэфіцыента Bad мадэлі PaLM2-XS на 5,74 працэнта. Акрамя таго, аптымізацыя прывяла да зніжэння сярэдняй затрымкі на 39,4%.
Перспектывы на будучыню
Гэта даследаванне дэманструе, як LLM могуць палепшыць карыстацкі досвед і стварыць інтрыгуючыя магчымасці для далейшага расследавання. Выкарыстанне даных рэальных карыстальнікаў, шматмоўная падтрымка, персанальная дапамога ў напісанні і рашэнні па канфідэнцыяльнасці прылад - гэта некалькі прыкладаў абласцей, якія могуць прывесці да далейшага прагрэсу ў сектары.
Google AI пашырае магчымасці тэхналогіі мабільнай клавіятуры з увядзеннем функцыі Proofread, паляпшаючы набор тэксту для людзей ва ўсім свеце.