Google AI는 최근 인기 모바일 키보드 애플리케이션인 Gboard에 'Proofread'라는 새로운 기능을 도입했습니다. 한 번의 탭으로 이 기능을 사용하면 문장 및 단락 수준에서 원활한 수정 및 수정이 가능하여 전반적인 타이핑 경험이 향상됩니다.
'뚱뚱한 손가락' 문제 해결
Gboard는 작은 화면에서 터치 입력이 자연적으로 부정확하게 발생하는 '뚱뚱한 손가락' 문제를 해결하기 위한 수단으로 통계적 디코딩을 사용합니다. 연구에 따르면 문자당 오류율은 해독하지 않고도 8~9%에 달할 수 있습니다. Gboard에는 더 쉽고 원활하게 입력할 수 있도록 다양한 오류 수정 기능이 제공됩니다. 이러한 기능은 사람의 입력과 관련된 수동 작업과 사전 예방적이고 자동화된 수정을 결합합니다.
포괄적인 오류 수정 도구
단어 완성, 다음 단어 예측, 활성 자동 수정(AC), 활성 키 수정(KC)을 포함하는 Gboard 기능을 통해 전체적으로 더 쉽게 입력할 수 있습니다. 이러한 도구에는 스마트 작성, 오류 수정, 제안 표시줄이나 인라인의 여러 단어 후보가 포함됩니다. 사후 수정(PC)은 이미 발생한 단어의 오류 수정을 용이하게 합니다. 이러한 기능에도 불구하고 두 가지 주요 제한 사항으로 인해 사용자 경험이 저하됩니다.
-
KC, AC, PC와 같은 기기 내 수정 모델은 빠르고 컴팩트하지만 더 긴 컨텍스트가 필요한 정교하고 복잡한 오류를 처리하는 데 어려움이 있습니다. 이러한 모델이 활성화되는 것을 방지하려면 사용자는 천천히 정확하게 입력해야 합니다.
-
사용자가 문법 및 맞춤법 검사기를 사용하여 약속된 단어를 수동으로 수정해야 하기 때문에 입력 속도가 감소하며 이는 정신적으로나 시각적으로 부담이 될 수 있습니다.
높은 수준의 오류 수정의 필요성
타자 속도가 빠른 사람은 이미 입력한 단어를 무시하고 키보드에만 집중하는 경우가 많습니다. 이로 인해 오류율이 높아질 수 있으므로 문장 또는 더 높은 수준의 수정 메커니즘을 사용해야 합니다.
교정 소개
Proofread는 눈에 띄는 생산성 향상을 제공하여 이러한 빈번한 불만을 해결합니다. 한 번의 탭으로 문장 및 단락 수준의 수정 기능을 제공하여 오류 수정이 더 간단해집니다.
교정 뒤에 숨은 기술
교정 기능은 데이터 생성, 측정항목 설계, 모델 조정, 모델 제공이라는 네 가지 기본 구성요소로 구성됩니다. 이러한 모든 구성 요소가 함께 효율성을 보장합니다. 데이터 배포가 Gboard 도메인과 일치하는지 확인하기 위해 시스템은 정확하고 체계적으로 구축된 오류 합성 아키텍처를 사용하여 빈번한 키보드 오류를 모방합니다.
고급 측정항목 및 모델 최적화
모델을 평가하기 위해 연구자들은 문법 오류 존재 확인 및 LLM(대형 언어 모델)에서 파생된 유사한 의미 확인에 특히 중점을 두고 다양한 측정항목을 통합했습니다. 모델을 개선하기 위해 InstructGPT 기술에서는 감독된 미세 조정 및 RL(강화 학습) 조정이 사용됩니다. 이 절차를 통해 모델의 교정 성능이 크게 향상됩니다.
배포 및 성능
8비트 양자화를 사용하는 중간 크기 LLM PaLM2-XS는 단일 TPU v5 내부에 맞도록 맞춤화되었으며 교정 기능의 기반 역할을 합니다. 최적화를 통해 서비스 비용이 절감됩니다. 이전 연구에서는 분할, 추측적 디코딩 및 버킷 키가 대기 시간을 줄일 수 있음이 입증되었습니다.
실제 영향
수만 명의 Pixel 8 사용자가 현재 사용할 수 있는 교정 기능이 제공하는 고품질 편집의 혜택을 누릴 것입니다. 철저한 합성 데이터 생성과 여러 차례의 미세 조정 반복을 통해 PaLM2-XS 모델의 Bad 비율이 5.74% 상대적으로 감소한 것처럼 문법 오류를 실질적으로 낮추는 모델이 생성되었습니다. 또한 최적화를 통해 평균 대기 시간이 39.4% 감소했습니다.
미래 전망
이 연구는 LLM이 어떻게 사용자 경험을 향상시키고 추가 조사를 위한 흥미로운 가능성을 창출할 수 있는지 보여줍니다. 실제 사용자 데이터의 사용, 다국어 지원, 맞춤형 글쓰기 지원 및 장치 개인 정보 보호 솔루션은 해당 분야의 추가 발전으로 이어질 수 있는 영역의 몇 가지 예입니다.
Google AI는 교정 기능을 도입하여 모바일 키보드 기술의 가능성을 확장하여 전 세계 사람들의 타이핑을 향상시키고 있습니다.