Google AI baru-baru ini memperkenalkan fitur baru yang disebut 'Proofread' pada Gboard, aplikasi keyboard seluler yang populer. Dengan satu ketukan, fitur ini memungkinkan modifikasi dan koreksi tanpa hambatan pada tingkat kalimat dan paragraf, sehingga meningkatkan pengalaman mengetik secara keseluruhan.
Mengatasi Masalah 'Jari Gemuk'
Gboard menggunakan penguraian kode statistik sebagai cara untuk mengatasi masalah "jari gemuk", yang merupakan ketidakakuratan alami input sentuhan di layar kecil. Penelitian menunjukkan bahwa tingkat kesalahan per huruf bisa mencapai 8 hingga 9 persen tanpa decoding. Gboard hadir dengan beberapa fitur koreksi kesalahan untuk membuat pengetikan lebih mudah dan lancar. Fitur-fitur ini menggabungkan tugas manual yang melibatkan masukan manusia dengan koreksi otomatis dan proaktif.
Alat Koreksi Kesalahan Komprehensif
Pengetikan menjadi lebih mudah secara kolektif dengan fitur Gboard, yang mencakup penyelesaian kata, prediksi kata berikutnya, koreksi otomatis aktif (AC), dan koreksi kunci aktif (KC). Alat-alat ini mencakup komposisi cerdas, koreksi kesalahan, dan kandidat beberapa kata di bilah saran atau sebaris. Pasca koreksi (PC) juga memfasilitasi perbaikan kesalahan kata yang telah dilakukan. Terlepas dari fitur-fitur ini, ada dua batasan utama yang mengganggu pengalaman pengguna.
-
Meskipun model koreksi pada perangkat seperti KC, AC, dan PC cepat dan ringkas, model tersebut mengalami kesulitan dalam menangani kesalahan yang canggih dan kompleks yang memerlukan konteks yang lebih panjang. Untuk mencegah pengaktifan model tersebut, pengguna harus mengetik dengan lambat dan tepat.
-
Kecepatan mengetik menurun karena pengguna harus mengoreksi kata-kata yang diucapkan secara manual menggunakan pemeriksa tata bahasa dan ejaan, yang dapat melelahkan secara mental dan visual.
Perlunya Koreksi Kesalahan Tingkat Tinggi
Pengetik cepat sering kali mengabaikan kata-kata yang telah mereka ketik dan hanya berkonsentrasi pada keyboard. Tingkat kesalahan yang lebih tinggi mungkin timbul dari hal ini, sehingga memerlukan penggunaan kalimat atau mekanisme koreksi tingkat yang lebih tinggi.
Memperkenalkan Koreksi
Proofread menyelesaikan keluhan yang sering terjadi ini dengan menawarkan peningkatan produktivitas yang signifikan. Itu membuat koreksi kesalahan lebih sederhana dengan menyediakan koreksi tingkat kalimat dan paragraf dengan satu ketukan.
Teknologi di Balik Proofread
Fitur Proofread terdiri dari empat komponen utama: produksi data, desain metrik, penyesuaian model, dan penyajian model. Bersama-sama, semua komponen ini menjamin efektivitas. Untuk memastikan bahwa distribusi data sejalan dengan domain Gboard, sistem meniru kesalahan keyboard yang sering terjadi menggunakan arsitektur sintetis kesalahan yang dibuat secara tepat dan metodis.
Metrik Tingkat Lanjut dan Pengoptimalan Model
Untuk menilai model tersebut, para peneliti telah memasukkan sejumlah metrik, dengan penekanan khusus pada pemeriksaan keberadaan kesalahan tata bahasa dan pemeriksaan makna serupa yang berasal dari model bahasa besar (LLM). Penyetelan halus yang diawasi dan penyetelan Reinforcement Learning (RL) digunakan dalam teknik InstructGPT untuk menyempurnakan model. Kinerja pengoreksian model sangat ditingkatkan dengan prosedur ini.
Penerapan dan Performa
Menggunakan kuantisasi 8-bit, LLM PaLM2-XS berukuran sedang disesuaikan agar muat di dalam satu TPU v5 dan berfungsi sebagai fondasi untuk fitur Proofread. Pengoptimalan menurunkan biaya penyajian. Penelitian sebelumnya telah menunjukkan bahwa segmentasi, decoding spekulatif, dan kunci bucket dapat mengurangi latensi.
Dampak Dunia Nyata
Puluhan ribu pengguna Pixel 8 akan mendapatkan keuntungan dari pengeditan berkualitas tinggi yang disediakan oleh fitur Proofread, yang kini tersedia. Pembuatan data sintetik secara menyeluruh dan beberapa kali penyesuaian telah menghasilkan model yang secara signifikan menurunkan kesalahan tata bahasa, seperti terlihat pada penurunan relatif sebesar 5,74 persen pada rasio Buruk model PaLM2-XS. Selain itu, pengoptimalan telah menghasilkan penurunan latensi median sebesar 39,4%.
Prospek Masa Depan
Studi ini menunjukkan bagaimana LLM dapat meningkatkan pengalaman pengguna dan menciptakan kemungkinan menarik untuk penyelidikan lebih lanjut. Penggunaan data pengguna sebenarnya, dukungan multibahasa, bantuan penulisan yang disesuaikan, dan solusi privasi perangkat adalah beberapa contoh bidang yang dapat membawa kemajuan lebih lanjut dalam sektor ini.
Google AI memperluas kemungkinan teknologi papan ketik seluler dengan diperkenalkannya fitur Proofread, sehingga meningkatkan pengetikan untuk orang-orang di seluruh dunia.