Google AI dévoile « Relecture » : fonctionnalité Gboard pour des corrections de phrases et de paragraphes sans effort

Google AI dévoile « Relecture » : fonctionnalité Gboard pour des corrections de phrases et de paragraphes sans effort

Google AI a récemment introduit une nouvelle fonctionnalité appelée « Relire » dans Gboard, l'application de clavier mobile populaire. D'un simple clic, cette fonctionnalité permet des modifications et des corrections transparentes au niveau des phrases et des paragraphes, améliorant ainsi l'expérience de frappe globale.

S'attaquer au problème du « gros doigt »

Gboard utilise le décodage statistique pour résoudre le problème du « gros doigt », qui correspond à l'imprécision naturelle de la saisie tactile sur les petits écrans. Les recherches montrent que le taux d'erreur par lettre peut atteindre 8 à 9 % sans décodage. Gboard est livré avec plusieurs fonctionnalités de correction d'erreurs pour rendre la saisie plus facile et plus fluide. Ces fonctionnalités combinent des tâches manuelles impliquant une intervention humaine avec des corrections proactives et automatisées.

Outils complets de correction d'erreurs

La saisie est facilitée collectivement par les fonctionnalités de Gboard, qui incluent la complétion des mots, les prédictions du mot suivant, la correction automatique active (AC) et la correction active des touches (KC). Ces outils incluent une composition intelligente, une correction d'erreurs et des candidats de plusieurs mots dans la barre de suggestions ou en ligne. La post-correction (PC) facilite également la rectification des erreurs de mots déjà commises. Malgré ces fonctionnalités, deux restrictions clés nuisent à l’expérience utilisateur.

  1. Bien que les modèles de correction sur appareil tels que KC, AC et PC soient rapides et compacts, ils ont du mal à gérer les erreurs sophistiquées et complexes qui nécessitent des contextes plus longs. Pour éviter que ces modèles ne soient activés, les utilisateurs doivent taper lentement et précisément.

  2. La vitesse de frappe diminue car les utilisateurs doivent corriger manuellement les mots engagés à l'aide de correcteurs de grammaire et d'orthographe, ce qui peut être éprouvant mentalement et visuellement.

La nécessité d'une correction d'erreur de haut niveau

Les dactylographes rapides ignorent souvent les mots qu’ils ont déjà tapés et se concentrent uniquement sur le clavier. Des taux d’erreur plus élevés peuvent en résulter, nécessitant le recours à des peines ou à des mécanismes de correction de niveau supérieur.

Présentation de la relecture

Proofread résout ces plaintes fréquentes en offrant des améliorations notables de la productivité. Il simplifie la correction des erreurs en fournissant des corrections en un seul clic au niveau des phrases et des paragraphes.

La technologie derrière la relecture

La fonctionnalité Proofread est composée de quatre composants principaux : la production de données, la conception de métriques, l'ajustement du modèle et la diffusion du modèle. Ensemble, tous ces composants garantissent l’efficacité. Pour garantir que la distribution des données est conforme au domaine Gboard, le système imite les erreurs de clavier fréquentes à l'aide d'une architecture synthétique d'erreurs construite avec précision et méthodique.

Métriques avancées et optimisation du modèle

Afin d'évaluer le modèle, les chercheurs ont incorporé un certain nombre de mesures, avec un accent particulier sur les contrôles de présence d'erreurs grammaticales et les contrôles de signification similaire dérivés de grands modèles de langage (LLM). Le réglage fin supervisé et le réglage de l'apprentissage par renforcement (RL) sont utilisés dans la technique InstructGPT pour améliorer le modèle. Les performances de relecture du modèle sont grandement améliorées par cette procédure.

Déploiement et performances

Utilisant une quantification sur 8 bits, le LLM PaLM2-XS de taille moyenne est conçu pour s'adapter à un seul TPU v5 et sert de base à la fonction de relecture. L'optimisation réduit le coût du service. Des recherches antérieures ont démontré que la segmentation, le décodage spéculatif et les clés de compartiment peuvent réduire la latence.

Impact dans le monde réel

Des dizaines de milliers d'utilisateurs de Pixel 8 bénéficieront des modifications de haute qualité fournies par la fonction de relecture, désormais disponible. Une génération approfondie de données synthétiques et plusieurs itérations de réglage fin ont produit un modèle qui réduit considérablement les erreurs grammaticales, comme en témoigne une diminution relative de 5,74 % du mauvais ratio du modèle PaLM2-XS. De plus, les optimisations ont entraîné une diminution de 39,4 % de la latence médiane.

Perspectives d'avenir

Cette étude démontre comment les LLM pourraient améliorer l'expérience utilisateur et créer des possibilités intrigantes pour des recherches plus approfondies. L'utilisation de données d'utilisateurs réels, la prise en charge multilingue, l'aide à la rédaction sur mesure et les solutions de confidentialité des appareils ne sont que quelques exemples de domaines qui pourraient conduire à de nouvelles avancées dans le secteur.

Google AI étend les possibilités de la technologie des claviers mobiles avec l'introduction de la fonctionnalité Proofread, améliorant ainsi la saisie pour les utilisateurs du monde entier.

Code Labs Academy © 2024 Tous droits réservés.