Google AI yakın zamanda popüler mobil klavye uygulaması Gboard'a 'Düzeltme' adı verilen yeni bir özelliği tanıttı. Bu özellik, tek bir dokunuşla cümle ve paragraf düzeylerinde kusursuz değişiklik ve düzeltmeler yapılmasını sağlayarak genel yazma deneyimini iyileştirir.
'Şişman Parmak' Problemini Çözmek
Gboard, küçük ekranlarda dokunmatik girişin doğal yanlışlığı olan "şişman parmak" sorununu çözmek için istatistiksel kod çözmeyi kullanır. Araştırmalar, kod çözmeden harf başına hata oranının yüzde 8 ila 9'a ulaşabildiğini gösteriyor. Gboard, yazmayı daha kolay ve sorunsuz hale getirmek için çeşitli hata düzeltme özellikleriyle birlikte gelir. Bu özellikler, insan girdisini içeren manuel görevleri proaktif, otomatik düzeltmelerle birleştirir.
Kapsamlı Hata Düzeltme Araçları
Yazma, Gboard'un kelime tamamlama, sonraki kelime tahminleri, aktif otomatik düzeltme (AC) ve aktif anahtar düzeltmeyi (KC) içeren özellikleri sayesinde toplu olarak daha kolay hale gelir. Bu araçlar arasında akıllı kompozisyon, hata düzeltme ve öneri çubuğunda veya satır içinde birden fazla kelime içeren adaylar bulunur. Düzeltme sonrası (PC), daha önce yapılmış kelimelerdeki hataların düzeltilmesini de kolaylaştırır. Bu özelliklere rağmen iki temel kısıtlama kullanıcı deneyimini olumsuz etkiliyor.
-
KC, AC ve PC gibi cihaz içi düzeltme modelleri hızlı ve kompakt olmasına rağmen, daha uzun bağlamlar gerektiren karmaşık ve karmaşık hataların üstesinden gelmekte zorluk çekerler. Bu modellerin etkinleştirilmesini önlemek için kullanıcıların yavaş ve hassas bir şekilde yazması gerekir.
-
Kullanıcıların, yazılan sözcükleri dilbilgisi ve yazım denetleyicileri kullanarak manuel olarak düzeltmek zorunda kalması sonucunda yazma hızı düşer; bu, zihinsel ve görsel olarak yorucu olabilir.
Üst Düzeyde Hata Düzeltme İhtiyacı
Hızlı yazanlar sıklıkla daha önce yazdıkları kelimeleri göz ardı eder ve yalnızca klavyeye odaklanırlar. Bundan daha yüksek hata oranları ortaya çıkabilir ve bu da ceza veya daha üst düzey düzeltme mekanizmalarının kullanılmasını gerektirebilir.
Proofread'e Giriş
Proofread, kayda değer üretkenlik artışları sunarak bu sık karşılaşılan şikayetleri çözmektedir. Tek dokunuşla cümle ve paragraf düzeyinde düzeltmeler sağlayarak hata düzeltmeyi kolaylaştırır.
Düzeltmenin Arkasındaki Teknoloji
Proofread özelliği dört ana bileşenden oluşur: veri üretimi, ölçüm tasarımı, model ayarlaması ve model sunumu. Bu bileşenlerin tümü birlikte etkinliği garanti eder. Veri dağıtımının Gboard alanıyla uyumlu olmasını sağlamak için sistem, hassas ve düzenli bir şekilde oluşturulmuş hata sentetik mimarisini kullanarak sık karşılaşılan klavye hatalarını taklit eder.
Gelişmiş Metrikler ve Model Optimizasyonu
Modeli değerlendirmek için araştırmacılar, dilbilgisi hatalarının varlığı kontrollerine ve büyük dil modellerinden (LLM'ler) türetilen benzer anlam kontrollerine özellikle vurgu yaparak bir dizi ölçümü birleştirdiler. Modeli geliştirmek için InstructGPT tekniğinde denetimli ince ayar ve Güçlendirme Öğrenme (RL) ayarı kullanılır. Modelin düzeltme performansı bu prosedürle büyük ölçüde geliştirildi.
Dağıtım ve Performans
8 bit niceleme kullanan orta boyutlu LLM PaLM2-XS, tek bir TPU v5'e sığacak şekilde tasarlandı ve Proofread özelliğinin temelini oluşturuyor. Optimizasyon, sunum maliyetini düşürür. Önceki araştırmalar, segmentasyonun, spekülatif kod çözmenin ve paket anahtarlarının gecikmeyi azaltabileceğini göstermiştir.
Gerçek Dünya Etkisi
On binlerce Pixel 8 kullanıcısı, artık mevcut olan Proofread özelliğinin sağladığı yüksek kaliteli düzenlemelerden yararlanacak. Kapsamlı bir sentetik veri üretimi ve birkaç ince ayar yinelemesi, PaLM2-XS modelinin Kötü oranındaki yüzde 5,74'lük göreceli azalmayla görüldüğü gibi, dilbilgisi hatalarını önemli ölçüde azaltan bir model üretti. Ayrıca optimizasyonlar ortalama gecikmede %39,4'lük bir azalmaya yol açtı.
Gelecek Beklentileri
Bu çalışma, Yüksek Lisans'ların kullanıcı deneyimini nasıl geliştirebileceğini ve daha ileri araştırmalar için ilgi çekici olanaklar yaratabileceğini göstermektedir. Gerçek kullanıcı verilerinin kullanımı, çok dilli destek, kişiye özel yazma yardımı ve cihaz gizliliği çözümleri, sektörde daha fazla ilerlemeye yol açabilecek alanlara birkaç örnektir.
Google AI, Proofread özelliğinin sunulmasıyla mobil klavye teknolojisinin olanaklarını genişletiyor ve dünyanın her yerindeki insanlar için yazmayı geliştiriyor.