Google AI gần đây đã giới thiệu một tính năng mới có tên là 'Proofread' cho Gboard, ứng dụng bàn phím di động phổ biến. Chỉ với một cú chạm, tính năng này cho phép sửa đổi và chỉnh sửa liền mạch ở cấp độ câu và đoạn văn, cải thiện trải nghiệm gõ tổng thể.
Giải quyết vấn đề 'Ngón tay béo'
Gboard sử dụng giải mã thống kê như một phương pháp để giải quyết vấn đề "ngón tay mập", vốn là sự thiếu chính xác tự nhiên của thao tác nhập bằng cảm ứng trên màn hình nhỏ. Nghiên cứu cho thấy tỷ lệ lỗi trên mỗi chữ cái có thể lên tới 8 đến 9 phần trăm nếu không giải mã. Gboard đi kèm với một số tính năng sửa lỗi để giúp việc nhập liệu dễ dàng và mượt mà hơn. Các tính năng này kết hợp các tác vụ thủ công liên quan đến đầu vào của con người với các chỉnh sửa tự động, chủ động.
Công cụ sửa lỗi toàn diện
Việc gõ phím trở nên dễ dàng hơn nhờ các tính năng của Gboard, bao gồm hoàn thành từ, dự đoán từ tiếp theo, tự động sửa chủ động (AC) và sửa phím chủ động (KC). Những công cụ này bao gồm bố cục thông minh, sửa lỗi và đề xuất nhiều từ trong thanh gợi ý hoặc nội tuyến. Việc sửa lỗi sau (PC) còn tạo điều kiện thuận lợi cho việc sửa lỗi ở những từ đã mắc phải. Bất chấp những tính năng này, có hai hạn chế chính làm giảm trải nghiệm người dùng.
-
Trong khi các mô hình sửa lỗi trên thiết bị như KC, AC và PC tuy nhanh và gọn nhưng lại gặp khó khăn trong việc xử lý các lỗi tinh vi, phức tạp cần bối cảnh dài hơn. Để ngăn các mô hình này được kích hoạt, người dùng phải gõ chậm và chính xác.
-
Tốc độ gõ giảm do người dùng phải sửa các từ đã cam kết theo cách thủ công bằng cách sử dụng trình kiểm tra ngữ pháp và chính tả, điều này có thể gây khó khăn về mặt tinh thần và thị giác.
Nhu cầu sửa lỗi ở cấp độ cao
Những người đánh máy nhanh thường bỏ qua những từ họ đã gõ và chỉ tập trung vào bàn phím. Tỷ lệ lỗi cao hơn có thể phát sinh từ điều này, đòi hỏi phải sử dụng câu hoặc cơ chế sửa lỗi ở cấp độ cao hơn.
Giới thiệu Hiệu đính
Hiệu đính giải quyết những khiếu nại thường gặp này bằng cách tăng năng suất đáng chú ý. Nó làm cho việc sửa lỗi trở nên đơn giản hơn bằng cách cung cấp các sửa lỗi ở cấp độ câu và đoạn văn chỉ bằng một cú chạm.
Công nghệ đằng sau việc hiệu đính
Tính năng Hiệu đính được tạo thành từ bốn thành phần chính: sản xuất dữ liệu, thiết kế số liệu, điều chỉnh mô hình và cung cấp mô hình. Cùng với nhau, tất cả các thành phần này đảm bảo hiệu quả. Để đảm bảo việc phân phối dữ liệu phù hợp với miền Gboard, hệ thống bắt chước các lỗi bàn phím thường gặp bằng cách sử dụng kiến trúc tổng hợp lỗi được xây dựng một cách chính xác và có phương pháp.
Tối ưu hóa mô hình và số liệu nâng cao
Để đánh giá mô hình, các nhà nghiên cứu đã kết hợp một số số liệu, đặc biệt chú trọng đến việc kiểm tra sự hiện diện của lỗi ngữ pháp và kiểm tra ý nghĩa tương tự bắt nguồn từ các mô hình ngôn ngữ lớn (LLM). Điều chỉnh tinh chỉnh có giám sát và Học tăng cường (RL) được sử dụng trong kỹ thuật InstructGPT để cải thiện mô hình. Hiệu suất hiệu đính của mô hình được cải thiện rất nhiều nhờ quy trình này.
Triển khai và Hiệu suất
Sử dụng lượng tử hóa 8 bit, LLM PaLM2-XS cỡ trung bình được thiết kế để vừa với một TPU v5 duy nhất và đóng vai trò làm nền tảng cho tính năng Hiệu đính. Việc tối ưu hóa làm giảm chi phí phục vụ. Nghiên cứu trước đây đã chứng minh rằng phân đoạn, giải mã suy đoán và khóa nhóm có thể làm giảm độ trễ.
Tác động trong thế giới thực
Hàng chục nghìn người dùng Pixel 8 sẽ được hưởng lợi từ các chỉnh sửa chất lượng cao do tính năng Hiệu đính hiện có sẵn. Việc tạo dữ liệu tổng hợp kỹ lưỡng và nhiều lần tinh chỉnh đã tạo ra một mô hình giúp giảm đáng kể lỗi ngữ pháp, thể hiện qua tỷ lệ Xấu của mô hình PaLM2-XS giảm tương đối 5,74%. Ngoài ra, việc tối ưu hóa đã giúp giảm 39,4% độ trễ trung bình.
Triển vọng tương lai
Nghiên cứu này chứng minh cách LLM có thể nâng cao trải nghiệm người dùng và tạo ra những khả năng hấp dẫn để nghiên cứu sâu hơn. Việc sử dụng dữ liệu người dùng thực, hỗ trợ đa ngôn ngữ, hỗ trợ viết phù hợp và giải pháp bảo mật thiết bị là một số ví dụ về các lĩnh vực có thể dẫn đến những tiến bộ hơn nữa trong lĩnh vực này.
Google AI đang mở rộng khả năng của công nghệ bàn phím di động với việc giới thiệu tính năng Proofread, cải thiện khả năng nhập liệu cho mọi người trên toàn thế giới.