Google AI เพิ่งเปิดตัวฟีเจอร์ใหม่ที่เรียกว่า "พิสูจน์อักษร" ใน Gboard ซึ่งเป็นแอปพลิเคชันแป้นพิมพ์บนมือถือยอดนิยม ด้วยการแตะเพียงครั้งเดียว คุณสมบัตินี้ช่วยให้สามารถแก้ไขและแก้ไขระดับประโยคและย่อหน้าได้อย่างราบรื่น ปรับปรุงประสบการณ์การพิมพ์โดยรวม
จัดการปัญหา 'นิ้วอ้วน'
Gboard ใช้การถอดรหัสทางสถิติเพื่อแก้ไขปัญหา "นิ้วอ้วน" ซึ่งเป็นความไม่ถูกต้องตามธรรมชาติของการป้อนข้อมูลแบบสัมผัสบนหน้าจอขนาดเล็ก การวิจัยแสดงให้เห็นว่าอัตราข้อผิดพลาดต่อตัวอักษรสามารถสูงถึง 8 ถึง 9 เปอร์เซ็นต์โดยไม่ต้องถอดรหัส Gboard มาพร้อมกับคุณสมบัติแก้ไขข้อผิดพลาดหลายประการเพื่อให้การพิมพ์ง่ายขึ้นและราบรื่นยิ่งขึ้น คุณสมบัติเหล่านี้รวมงานที่ต้องทำด้วยตนเองที่เกี่ยวข้องกับการป้อนข้อมูลของมนุษย์เข้ากับการแก้ไขอัตโนมัติในเชิงรุก
เครื่องมือแก้ไขข้อผิดพลาดที่ครอบคลุม
การพิมพ์โดยรวมทำได้ง่ายขึ้นด้วยฟีเจอร์ของ Gboard ซึ่งรวมถึงการเติมคำ การคาดเดาคำถัดไป การแก้ไขอัตโนมัติที่ใช้งานอยู่ (AC) และการแก้ไขคีย์ที่ใช้งานอยู่ (KC) เครื่องมือเหล่านี้ประกอบด้วยการจัดองค์ประกอบอัจฉริยะ การแก้ไขข้อผิดพลาด และตัวเลือกคำหลายคำในแถบคำแนะนำหรืออินไลน์ หลังการแก้ไข (PC) ยังอำนวยความสะดวกในการแก้ไขข้อผิดพลาดในคำที่ได้กระทำไปแล้ว แม้จะมีคุณสมบัติเหล่านี้ แต่ข้อจำกัดสำคัญสองประการก็ทำให้ประสบการณ์ผู้ใช้แย่ลง
-
แม้ว่าโมเดลการแก้ไขบนอุปกรณ์ เช่น KC, AC และ PC จะทำงานได้อย่างรวดเร็วและกะทัดรัด แต่ก็มีปัญหาในการจัดการข้อผิดพลาดที่ซับซ้อนและซับซ้อนซึ่งต้องใช้บริบทที่ยาวขึ้น เพื่อป้องกันไม่ให้โมเดลเหล่านี้ถูกเปิดใช้งาน ผู้ใช้จะต้องพิมพ์ช้าๆ และแม่นยำ
-
ความเร็วในการพิมพ์ลดลงเนื่องจากการที่ผู้ใช้ต้องแก้ไขคำที่คอมมิตด้วยตนเองโดยใช้เครื่องตรวจสอบไวยากรณ์และการสะกดคำ ซึ่งอาจทำให้เสียสมาธิและการมองเห็นได้
ความจำเป็นในการแก้ไขข้อผิดพลาดระดับสูง
ผู้พิมพ์เร็วมักมองข้ามคำที่พิมพ์ไปแล้วและมุ่งความสนใจไปที่แป้นพิมพ์เท่านั้น อัตราข้อผิดพลาดที่สูงขึ้นอาจเกิดขึ้นจากสิ่งนี้ จำเป็นต้องใช้ประโยคหรือกลไกการแก้ไขในระดับที่สูงกว่า
แนะนำการพิสูจน์อักษร
Proofread ช่วยแก้ไขข้อร้องเรียนที่พบบ่อยเหล่านี้โดยนำเสนอการเพิ่มประสิทธิภาพการทำงานที่โดดเด่น ทำให้การแก้ไขข้อผิดพลาดง่ายขึ้นโดยให้การแก้ไขระดับประโยคและย่อหน้าด้วยการแตะเพียงครั้งเดียว
เทคโนโลยีเบื้องหลังการพิสูจน์อักษร
คุณลักษณะการพิสูจน์อักษรประกอบด้วยสี่องค์ประกอบหลัก: การผลิตข้อมูล การออกแบบหน่วยเมตริก การปรับแต่งโมเดล และการให้บริการโมเดล ส่วนประกอบทั้งหมดเหล่านี้ร่วมกันรับประกันประสิทธิภาพ เพื่อให้แน่ใจว่าการกระจายข้อมูลสอดคล้องกับโดเมน Gboard ระบบจะเลียนแบบข้อผิดพลาดของแป้นพิมพ์บ่อยครั้งโดยใช้สถาปัตยกรรมสังเคราะห์ข้อผิดพลาดที่สร้างขึ้นอย่างแม่นยำและมีระบบ
การวัดขั้นสูงและการเพิ่มประสิทธิภาพโมเดล
เพื่อประเมินแบบจำลองนี้ นักวิจัยได้รวมตัวชี้วัดจำนวนหนึ่ง โดยเน้นไปที่การตรวจสอบข้อผิดพลาดทางไวยากรณ์และการตรวจสอบความหมายที่คล้ายกันซึ่งได้มาจากแบบจำลองภาษาขนาดใหญ่ (LLM) การปรับแต่งแบบละเอียดภายใต้การดูแลและการปรับแต่งการเรียนรู้แบบเสริมกำลัง (RL) ใช้ในเทคนิค InstructGPT เพื่อปรับปรุงโมเดล ประสิทธิภาพการพิสูจน์อักษรของแบบจำลองได้รับการปรับปรุงอย่างมากโดยขั้นตอนนี้
การปรับใช้และประสิทธิภาพ
การใช้การวัดปริมาณ 8 บิต LLM PaLM2-XS ขนาดกลางได้รับการปรับแต่งให้พอดีกับภายใน TPU v5 เดียว และทำหน้าที่เป็นรากฐานสำหรับคุณลักษณะการพิสูจน์อักษร การเพิ่มประสิทธิภาพจะช่วยลดต้นทุนการให้บริการ การวิจัยก่อนหน้านี้ได้แสดงให้เห็นว่าการแบ่งส่วน การถอดรหัสแบบเก็งกำไร และบัคเก็ตคีย์สามารถลดเวลาในการตอบสนองได้
ผลกระทบในโลกแห่งความเป็นจริง
ผู้ใช้ Pixel 8 นับหมื่นรายจะได้รับประโยชน์จากการแก้ไขคุณภาพสูงจากฟีเจอร์ Proofread ซึ่งขณะนี้มีให้บริการแล้ว การสร้างข้อมูลสังเคราะห์อย่างละเอียดและการปรับแต่งอย่างละเอียดหลายครั้งทำให้เกิดแบบจำลองที่ช่วยลดข้อผิดพลาดทางไวยากรณ์ได้อย่างมาก โดยเห็นได้จากอัตราส่วน Bad ของโมเดล PaLM2-XS ที่ลดลง 5.74 เปอร์เซ็นต์ นอกจากนี้ การเพิ่มประสิทธิภาพยังส่งผลให้เวลาแฝงเฉลี่ยลดลง 39.4%
อนาคตในอนาคต
การศึกษานี้ แสดงให้เห็นว่า LLM อาจปรับปรุงประสบการณ์ผู้ใช้และสร้างความเป็นไปได้ที่น่าสนใจสำหรับการตรวจสอบเพิ่มเติมได้อย่างไร การใช้ข้อมูลผู้ใช้จริง การสนับสนุนหลายภาษา ความช่วยเหลือในการเขียนที่ปรับให้เหมาะสม และโซลูชันความเป็นส่วนตัวของอุปกรณ์ เป็นเพียงตัวอย่างบางส่วนของพื้นที่ที่อาจนำไปสู่ความก้าวหน้าเพิ่มเติมในภาคส่วนนี้
Google AI กำลังขยายความเป็นไปได้ของเทคโนโลยีคีย์บอร์ดมือถือด้วยการเปิดตัวฟีเจอร์ Proofread ซึ่งปรับปรุงการพิมพ์สำหรับผู้คนทั่วโลก