Ipinakilala kamakailan ng Google AI ang isang bagong feature na tinatawag na 'Proofread' sa Gboard, ang sikat na mobile keyboard application. Sa isang pag-tap, nagbibigay-daan ang feature na ito para sa mga walang putol na pagbabago at pagwawasto sa mga antas ng pangungusap at talata, na nagpapahusay sa pangkalahatang karanasan sa pagta-type.
Pagharap sa Problema sa 'Fat Finger'
Gumagamit ang Gboard ng istatistikal na pag-decode bilang isang paraan ng pagtugon sa isyu ng "fat finger", na kung saan ay ang natural na hindi kawastuhan ng touch input sa maliliit na screen. Ipinapakita ng pananaliksik na ang rate ng error sa bawat titik ay maaaring umabot sa 8 hanggang 9 na porsyento nang walang pag-decode. Ang Gboard ay may kasamang ilang feature sa pagwawasto ng error para gawing mas madali at mas maayos ang pag-type. Pinagsasama ng mga feature na ito ang mga manu-manong gawain na kinasasangkutan ng pag-input ng tao sa mga maagap at awtomatikong pagwawasto.
Comprehensive Error Correction Tools
Ang pag-type ay pinagsama-samang pinadali ng mga feature ng Gboard, na kinabibilangan ng pagkumpleto ng salita, mga hula sa susunod na salita, aktibong auto-correction (AC), at aktibong pagwawasto ng key (KC). Kasama sa mga tool na ito ang matalinong komposisyon, pagwawasto ng error, at maraming salita na kandidato sa suggestion bar o inline. Ang post-correction (PC) ay nagpapadali din sa pagwawasto ng mga pagkakamali sa mga salita na nagawa na. Sa kabila ng mga feature na ito, dalawang pangunahing paghihigpit ang nakakapinsala sa karanasan ng user.
-
Bagama't mabilis at compact ang mga modelo ng pagwawasto sa device gaya ng KC, AC, at PC, nahihirapan silang humawak ng mga sopistikado at kumplikadong error na nangangailangan ng mas mahabang konteksto. Upang maiwasang ma-activate ang mga modelong ito, dapat na mabagal at tumpak ang pag-type ng mga user.
-
Bumababa ang bilis ng pag-type bilang resulta ng mga user na kailangang manu-manong iwasto ang mga nakatuong salita gamit ang grammar at spell checker, na maaaring nakakapagod sa pag-iisip at sa paningin.
Ang Pangangailangan para sa High-Level Error Correction
Ang mga mabibilis na typer ay madalas na binabalewala ang mga salitang na-type na nila at nakatutok lamang sa keyboard. Ang mas mataas na mga rate ng error ay maaaring lumabas mula dito, na nangangailangan ng paggamit ng pangungusap o mas mataas na antas ng mga mekanismo ng pagwawasto.
Ipinapakilala ang Proofread
Niresolba ng Proofread ang mga madalas na reklamong ito sa pamamagitan ng pag-aalok ng mga kapansin-pansing pagtaas ng produktibidad. Ginagawa nitong mas simple ang pagwawasto ng error sa pamamagitan ng pagbibigay ng one-tap na mga pagwawasto sa antas ng pangungusap at talata.
Ang Teknolohiya sa Likod ng Proofread
Ang feature na Proofread ay binubuo ng apat na pangunahing bahagi: produksyon ng data, disenyo ng sukatan, pagsasaayos ng modelo, at paghahatid ng modelo. Magkasama, ginagarantiyahan ng lahat ng mga sangkap na ito ang pagiging epektibo. Upang matiyak na ang pamamahagi ng data ay naaayon sa domain ng Gboard, ginagaya ng system ang madalas na mga error sa keyboard gamit ang isang tumpak at pamamaraan na binuo ng synthetic architecture ng error.
Mga Advanced na Sukatan at Pag-optimize ng Modelo
Upang masuri ang modelo, nagsama ang mga mananaliksik ng ilang sukatan, na may partikular na diin sa mga pagsusuri sa presensya ng error sa gramatika at mga katulad na pagsusuri sa kahulugan na nagmula sa mga malalaking modelo ng wika (LLM). Ang pinangangasiwaang fine-tuning at Reinforcement Learning (RL) tuning ay ginagamit sa InstructGPT technique upang mapabuti ang modelo. Ang pagganap ng pag-proofread ng modelo ay lubos na napabuti ng pamamaraang ito.
Deployment at Performance
Gamit ang 8-bit na quantization, ang medium-sized na LLM PaLM2-XS ay iniakma upang magkasya sa loob ng isang TPU v5 at nagsisilbing pundasyon para sa feature na Proofread. Ang pag-optimize ay nagpapababa sa halaga ng paghahatid. Ipinakita ng naunang pananaliksik na ang segmentation, speculative decoding, at bucket key ay maaaring mabawasan ang latency.
Real-World Epekto
Sampu-sampung libong mga user ng Pixel 8 ang makikinabang mula sa mataas na kalidad na mga pag-edit na ibinigay ng feature na Proofread, na available na ngayon. Ang isang masusing henerasyon ng sintetikong data at ilang mga pag-ulit ng fine-tuning ay nakagawa ng isang modelo na lubos na nagpapababa ng mga grammatical error, gaya ng nakikita ng 5.74 porsiyentong kamag-anak na pagbaba sa Bad ratio ng PaLM2-XS na modelo. Bukod pa rito, nagresulta ang mga pag-optimize sa 39.4% na pagbaba sa median latency.
Mga Prospect sa Hinaharap
Ang pag-aaral na ito ay nagpapakita kung paano maaaring mapahusay ng mga LLM ang karanasan ng user at lumikha ng mga nakakaintriga na posibilidad para sa karagdagang pagsisiyasat. Ang paggamit ng data ng totoong user, suporta sa maraming wika, tulong sa pagsusulat, at mga solusyon sa privacy ng device ay ilang halimbawa ng mga lugar na maaaring humantong sa karagdagang pag-unlad sa sektor.
Pinapalawak ng Google AI ang mga posibilidad ng teknolohiya ng mobile na keyboard sa pagpapakilala ng feature na Proofread, na nagpapahusay sa pag-type para sa mga tao sa buong mundo.