Google AI "Түзөтмө окууну" ачат: сүйлөмдөрдү жана абзацтарды оңой оңдоо үчүн Gboard функциясы

Жаңыртылды September 23, 2024 3 Протокол окуу

Google AI жакында эле таанымал мобилдик клавиатура колдонмосу болгон Gboard’га “Proofread” деп аталган жаңы функцияны киргизди. Бир чыкылдатуу менен бул функция сүйлөм жана абзац деңгээлинде үзгүлтүксүз өзгөртүүлөрдү жана оңдоолорду жүргүзүүгө мүмкүндүк берип, жалпы терүү тажрыйбасын жакшыртат.

”Май бармак” көйгөйүн чечүү

Gboard “майлуу манжа” маселесин чечүүнүн каражаты катары статистикалык декоддоону колдонот, бул кичинекей экрандарда тийүү менен киргизүүнүн табигый так эместиги. Изилдөөлөр көрсөткөндөй, ар бир тамгадагы ката декоддоосуз 8-9 пайызга чейин жетиши мүмкүн. Gboard терүүнү жеңилдетүү жана жылмакай кылуу үчүн каталарды оңдоонун бир нече функциялары менен келет. Бул функциялар адамдын киргизүүнү камтыган кол тапшырмаларын активдүү, автоматташтырылган оңдоолор менен айкалыштырат.

Каталарды оңдоонун комплекстүү куралдары

Терүү Gboard’дун сөздү аяктоо, кийинки сөздү болжолдоо, активдүү автотүзөө (AC) жана активдүү ачкычты оңдоону (KC) камтыган функциялары менен чогуу жеңилдетет. Бул инструменттер акылдуу композицияны, каталарды оңдоону жана сунуш тилкесинде же сапта бир нече сөздөн турган талапкерлерди камтыйт. Пост-түзөтүү (ПК) ошондой эле буга чейин жасалган сөздөрдөгү каталарды оңдоого көмөктөшөт. Бул өзгөчөлүктөргө карабастан, эки негизги чектөөлөр колдонуучу тажрыйбасын начарлатат.

KC, AC жана PC сыяктуу түзмөктөгү оңдоо моделдери тез жана компакттуу болгону менен, алар узак контекстти талап кылган татаал жана татаал каталарды чечүүдө кыйынчылыктарга дуушар болушат. Бул моделдердин жандырылышына жол бербөө үчүн колдонуучулар жай жана так териши керек.
Терүү ылдамдыгы колдонуучулардын грамматика жана орфография текшергичтерин колдонуу менен жасалган сөздөрдү кол менен оңдоого туура келишинин натыйжасында төмөндөйт, бул акыл-эс жана визуалдык жактан оор болушу мүмкүн.

Жогорку деңгээлдеги каталарды оңдоо муктаждыгы

Тез терүүчүлөр көбүнчө терген сөздөрүн этибарга албай, клавиатурага гана көңүл бурушат. Ушундан улам каталардын жогорку деңгээли келип чыгышы мүмкүн, бул сүйлөмдөрдү же жогорку деңгээлдеги оңдоо механизмдерин колдонууну талап кылат.

Коррекциялоону киргизүү

Proofread көрүнүктүү өндүрүмдүүлүктү жогорулатуу менен бул тез-тез даттанууларды чечет. Ал бир таптап сүйлөм жана абзац деңгээлиндеги оңдоолорду камсыз кылуу менен катаны оңдоону жеңилдетет.

Текшерүүнүн артындагы технология

Proofread өзгөчөлүгү төрт негизги компоненттен турат: маалыматтарды өндүрүү, метрикалык дизайн, моделди өзгөртүү жана моделди тейлөө. Бул компоненттердин баары чогуу натыйжалуулугун камсыз кылат. Дайындарды бөлүштүрүү Gboard доменине ылайык болушун камсыздоо үчүн, система так жана методикалык түрдө курулган ката синтетикалык архитектурасын колдонуп клавиатура каталарын туурайт.

Өркүндөтүлгөн метрика жана моделди оптималдаштыруу

Модельди баалоо үчүн, изилдөөчүлөр грамматикалык каталардын бар экендигин текшерүүгө жана чоң тил моделдеринен (LLMs) алынган окшош маанилерди текшерүүгө өзгөчө басым жасоо менен бир катар метрикаларды киргизишти. Моделди өркүндөтүү үчүн InstructGPT техникасында көзөмөлгө алынган тактоо жана бекемдөөчү үйрөнүү (RL) тюнинг колдонулат. Бул процедуранын жардамы менен моделдин корректордук көрсөткүчтөрү жакшыртылды.

Жайгаштыруу жана аткаруу

8 биттик квантташтырууну колдонуу менен, орто өлчөмдөгү LLM PaLM2-XS бир TPU v5 ичине ылайыкташтырылган жана Proofread функциясы үчүн негиз катары кызмат кылат. Оптималдаштыруу тейлөөнүн баасын төмөндөтөт. Мурунку изилдөөлөр сегменттөө, спекулятивдүү декоддоо жана чака ачкычтары күтүү убактысын азайта аларын көрсөттү.

Чыныгы дүйнө таасири

Он миңдеген Pixel 8 колдонуучулары азыр жеткиликтүү болгон Proofread функциясы берген жогорку сапаттагы түзөтүүлөрдөн пайда алышат. Синтетикалык маалыматтардын кылдат мууну жана тактоолордун бир нече итерациялары PaLM2-XS моделинин Начар катышынын 5,74 пайызга салыштырмалуу төмөндөшүнөн көрүнүп тургандай, грамматикалык каталарды олуттуу түрдө азайткан моделди түздү. Кошумчалай кетсек, оптималдаштыруу медианалык күтүү мөөнөтүн 39,4% га төмөндөтүүгө алып келди.

Келечек перспективалары

Бул изилдөө LLMлер кантип колдонуучу тажрыйбасын жакшыртаарын жана андан аркы иликтөө үчүн кызыктуу мүмкүнчүлүктөрдү түзө аларын көрсөтөт. Чыныгы колдонуучунун маалыматтарын колдонуу, көп тилдүү колдоо, ылайыкташтырылган жазуу жардамы жана түзмөктүн купуялык чечимдери сектордогу мындан аркы ийгиликтерге алып келе турган аймактардын бир нече мисалы болуп саналат.

Google AI мобилдик клавиатура технологиясынын мүмкүнчүлүктөрүн Proofread функциясын киргизүү менен кеңейтип, дүйнө жүзүндөгү адамдар үчүн терүүнү жакшыртат.