Google AI վերջերս ներկայացրեց նոր գործառույթ, որը կոչվում է «Proofread» շարժական ստեղնաշարի հանրահայտ հավելված Gboard-ում: Մեկ հպումով այս հատկությունը թույլ է տալիս անխափան փոփոխություններ և ուղղումներ կատարել նախադասության և պարբերության մակարդակներում՝ բարելավելով մուտքագրման ընդհանուր փորձը:
«Ճարպ մատի» խնդրի լուծում
Gboard օգտագործում է վիճակագրական ապակոդավորում՝ որպես «գեր մատի» խնդիրը լուծելու միջոց, որը փոքր էկրանների վրա հպումի մուտքագրման բնական անճշտությունն է: Հետազոտությունները ցույց են տալիս, որ մեկ տառի համար սխալի մակարդակը կարող է հասնել 8-ից 9 տոկոսի՝ առանց վերծանման: Gboard-ն ունի սխալներ շտկող մի քանի գործառույթներ՝ մուտքագրումն ավելի հեշտ և սահուն դարձնելու համար: Այս հատկանիշները համատեղում են ձեռքով առաջադրանքները, որոնք ներառում են մարդկային ներդրում, ակտիվ, ավտոմատացված ուղղումներով:
Սխալների ուղղման համապարփակ գործիքներ
Մուտքագրումը ընդհանուր առմամբ հեշտացվում է Gboard-ի գործառույթների շնորհիվ, որոնք ներառում են բառի լրացում, հաջորդ բառի կանխատեսումներ, ակտիվ ավտոմատ ուղղում (AC) և ակտիվ բանալիների ուղղում (KC): Այս գործիքները ներառում են խելացի կոմպոզիցիա, սխալի ուղղում և բազմաթիվ բառերի թեկնածուներ առաջարկների տողում կամ ներդիրում: Հետուղղումը (ՀՀ) նաև հեշտացնում է արդեն իսկ կատարված բառերի սխալների ուղղումը: Չնայած այս հատկանիշներին, երկու հիմնական սահմանափակումները խաթարում են օգտագործողի փորձը:
-
Թեև սարքի վրա շտկելու մոդելները, ինչպիսիք են KC-ն, AC-ը և PC-ն, արագ և կոմպակտ են, նրանք դժվարանում են հաղթահարել բարդ և բարդ սխալները, որոնք պահանջում են ավելի երկար համատեքստեր: Այս մոդելների ակտիվացումը կանխելու համար օգտվողները պետք է դանդաղ և ճշգրիտ մուտքագրեն:
-
Մուտքագրման արագությունը նվազում է, քանի որ օգտատերերը ստիպված են լինում ձեռքով ուղղել ստանձնած բառերը՝ օգտագործելով քերականության և ուղղագրության ստուգիչները, ինչը կարող է հոգեպես և տեսողականորեն բարդացնել:
Բարձր մակարդակի սխալների ուղղման անհրաժեշտությունը
Արագ մեքենագրողները հաճախ անտեսում են արդեն իսկ մուտքագրած բառերը և կենտրոնանում միայն ստեղնաշարի վրա: Սրանից կարող են առաջանալ սխալների ավելի բարձր տեմպեր, որոնք պահանջում են նախադասության կամ ավելի բարձր մակարդակի ուղղման մեխանիզմների կիրառում:
Ներկայացնում ենք սրբագրումը
Սրբագրումը լուծում է այս հաճախակի բողոքները՝ առաջարկելով զգալի արտադրողականության բարձրացում: Այն հեշտացնում է սխալների ուղղումը` ապահովելով մեկ հպումով նախադասության և պարբերության մակարդակի ուղղումներ:
Տեխնոլոգիան սրբագրման հետևում
Սրբագրման գործառույթը բաղկացած է չորս հիմնական բաղադրիչներից՝ տվյալների արտադրություն, չափումների ձևավորում, մոդելի ճշգրտում և մոդելի սպասարկում: Այս բոլոր բաղադրիչները միասին երաշխավորում են արդյունավետությունը: Ապահովելու համար, որ տվյալների բաշխումը համահունչ է Gboard տիրույթին, համակարգը կրկնօրինակում է ստեղնաշարի հաճախակի սխալները՝ օգտագործելով ճշգրիտ և մեթոդականորեն կառուցված սխալների սինթետիկ ճարտարապետությունը:
Ընդլայնված չափումներ և մոդելների օպտիմիզացում
Մոդելը գնահատելու համար հետազոտողները ներառել են մի շարք չափումներ՝ հատուկ շեշտադրելով քերականական սխալների առկայության ստուգումները և համանման նշանակության ստուգումները, որոնք բխում են մեծ լեզվական մոդելներից (LLMs): Մոդելը բարելավելու համար InstructGPT տեխնիկայում օգտագործվում են վերահսկվող ճշգրտման և ուժեղացման ուսուցման (RL) թյունինգը: Մոդելի սրբագրման աշխատանքը զգալիորեն բարելավվում է այս ընթացակարգով:
Տեղակայում և կատարում
Օգտագործելով 8-բիթանոց քվանտացումը՝ միջին չափի LLM PaLM2-XS-ը հարմարեցված է մեկ TPU v5-ի ներսում տեղավորվելու համար և ծառայում է որպես սրբագրման գործառույթի հիմք: Օպտիմալացումը նվազեցնում է սպասարկման արժեքը: Նախկին հետազոտությունները ցույց են տվել, որ հատվածավորումը, սպեկուլյատիվ ապակոդավորումը և դույլ ստեղները կարող են նվազեցնել ուշացումը:
Ազդեցություն իրական աշխարհի վրա
Pixel 8-ի տասնյակ հազարավոր օգտատերեր կշահեն «Ստուգել» գործառույթի կողմից տրամադրվող բարձրորակ խմբագրումներից, որն այժմ հասանելի է: Սինթետիկ տվյալների մանրակրկիտ սերունդը և ճշգրտման մի քանի կրկնությունները ստեղծել են մի մոդել, որն էականորեն նվազեցնում է քերականական սխալները, ինչը երևում է PaLM2-XS մոդելի վատ հարաբերակցության 5,74 տոկոս հարաբերական նվազմամբ: Բացի այդ, օպտիմալացումները հանգեցրել են միջին ուշացման 39.4%-ով նվազմանը:
Ապագա հեռանկարներ
Այս ուսումնասիրությունը ցույց է տալիս, թե ինչպես LLM-ները կարող են բարելավել օգտվողների փորձը և ստեղծել հետաքրքիր հնարավորություններ հետագա հետաքննության համար: Իրական օգտատերերի տվյալների օգտագործումը, բազմալեզու աջակցությունը, գրելու հարմարեցված օգնությունը և սարքի գաղտնիության լուծումները այն ոլորտների մի քանի օրինակներ են, որոնք կարող են հանգեցնել ոլորտում հետագա առաջընթացի:
Google AI-ն ընդլայնում է շարժական ստեղնաշարի տեխնոլոգիայի հնարավորությունները՝ «Ստուգել» գործառույթի ներդրմամբ՝ բարելավելով մուտքագրումը ամբողջ աշխարհի մարդկանց համար: