Inscríbete en nuestras nuevas cohortes de Data Science & AI y Cybersecurity a tiempo parcial

Google AI presenta 'Revisión': función Gboard para correcciones de oraciones y párrafos sin esfuerzo

Google AI presenta 'Revisión': función Gboard para correcciones de oraciones y párrafos sin esfuerzo

Google AI introdujo recientemente una nueva función llamada 'Revisión' en Gboard, la popular aplicación de teclado móvil. Con un solo toque, esta función permite realizar modificaciones y correcciones fluidas a nivel de oración y párrafo, mejorando la experiencia general de escritura.

Abordar el problema del "dedo gordo"

Gboard utiliza la decodificación estadística como una forma de abordar el problema del "dedo gordo", que es la imprecisión natural de la entrada táctil en pantallas pequeñas. Las investigaciones muestran que la tasa de error por letra puede alcanzar del 8 al 9 por ciento sin decodificar. Gboard viene con varias funciones de corrección de errores para que escribir sea más fácil y fluido. Estas características combinan tareas manuales que involucran intervención humana con correcciones proactivas y automatizadas.

Herramientas integrales de corrección de errores

Escribir se hace más fácil en conjunto gracias a las funciones de Gboard, que incluyen finalización de palabras, predicciones de la siguiente palabra, autocorrección activa (AC) y corrección de clave activa (KC). Estas herramientas incluyen composición inteligente, corrección de errores y candidatos de varias palabras en la barra de sugerencias o en línea. La postcorrección (PC) también facilita la rectificación de errores en palabras que ya se han cometido. A pesar de estas características, dos restricciones clave perjudican la experiencia del usuario.

  1. Si bien los modelos de corrección en el dispositivo, como KC, AC y PC, son rápidos y compactos, tienen dificultades para manejar errores sofisticados y complejos que necesitan contextos más largos. Para evitar que estos modelos se activen, los usuarios deben escribir de forma lenta y precisa.

  2. La velocidad de escritura disminuye como resultado de que los usuarios tienen que corregir manualmente las palabras comprometidas utilizando correctores gramaticales y ortográficos, lo que puede resultar agotador mental y visualmente.

La necesidad de una corrección de errores de alto nivel

Las personas que escriben rápido con frecuencia ignoran las palabras que ya han escrito y se concentran únicamente en el teclado. De esto pueden surgir tasas de error más altas, lo que requiere el uso de sentencias o mecanismos de corrección de nivel superior.

Presentamos la revisión

Proofread resuelve estas quejas frecuentes ofreciendo aumentos notables de productividad. Simplifica la corrección de errores al proporcionar correcciones a nivel de oración y párrafo con un solo toque.

La tecnología detrás de la revisión

La función Revisión se compone de cuatro componentes principales: producción de datos, diseño de métricas, ajuste de modelos y servicio de modelos. Juntos, todos estos componentes garantizan la eficacia. Para garantizar que la distribución de datos esté en línea con el dominio de Gboard, el sistema imita los errores frecuentes del teclado utilizando una arquitectura sintética de errores construida de manera precisa y metódica.

Métricas avanzadas y optimización de modelos

Para evaluar el modelo, los investigadores han incorporado una serie de métricas, con especial énfasis en comprobaciones de presencia de errores gramaticales y comprobaciones de significado similares derivadas de modelos de lenguaje grandes (LLM). En la técnica InstructGPT se utilizan el ajuste fino supervisado y el aprendizaje por refuerzo (RL) para mejorar el modelo. Este procedimiento mejora enormemente el rendimiento de revisión del modelo.

Implementación y rendimiento

Utilizando cuantificación de 8 bits, el LLM PaLM2-XS de tamaño mediano está diseñado para caber dentro de un único TPU v5 y sirve como base para la función Proofread. La optimización reduce el costo de servicio. Investigaciones anteriores han demostrado que la segmentación, la decodificación especulativa y las claves de depósito pueden reducir la latencia.

Impacto en el mundo real

Decenas de miles de usuarios de Pixel 8 se beneficiarán de las ediciones de alta calidad proporcionadas por la función Corrección, que ya está disponible. Una generación exhaustiva de datos sintéticos y varias iteraciones de ajuste han producido un modelo que reduce sustancialmente los errores gramaticales, como se ve en una disminución relativa del 5,74 por ciento en el índice malo del modelo PaLM2-XS. Además, las optimizaciones han dado como resultado una disminución del 39,4 % en la latencia media.

Perspectivas de futuro

Este estudio demuestra cómo los LLM podrían mejorar la experiencia del usuario y crear posibilidades interesantes para una mayor investigación. El uso de datos de usuarios reales, soporte multilingüe, asistencia de escritura personalizada y soluciones de privacidad de dispositivos son algunos ejemplos de áreas que podrían conducir a mayores avances en el sector.

Google AI está ampliando las posibilidades de la tecnología de teclado móvil con la introducción de la función Corrección, mejorando la escritura para personas de todo el mundo.

Code Labs Academy © 2024 Todos los derechos reservados.