Το Google AI αποκαλύπτει το "Proofread": Λειτουργία Gboard για εύκολες διορθώσεις προτάσεων και παραγράφων

Ενημερώθηκε για το June 13, 2024 4 λεπτά ανάγνωση

Το Google AI εισήγαγε πρόσφατα μια νέα δυνατότητα που ονομάζεται «Διόρθωση» στο Gboard, τη δημοφιλή εφαρμογή πληκτρολογίου για κινητά. Με ένα μόνο πάτημα, αυτή η λειτουργία επιτρέπει απρόσκοπτες τροποποιήσεις και διορθώσεις σε επίπεδο πρότασης και παραγράφου, βελτιώνοντας τη συνολική εμπειρία πληκτρολόγησης.

Αντιμετώπιση του προβλήματος «Fat Finger».

Το Gboard χρησιμοποιεί στατιστική αποκωδικοποίηση ως μέσο αντιμετώπισης του προβλήματος “παχύ δάχτυλο”, το οποίο είναι η φυσική ανακρίβεια της εισαγωγής αφής σε μικρές οθόνες. Η έρευνα δείχνει ότι το ποσοστό σφάλματος ανά γράμμα μπορεί να φτάσει το 8 έως 9 τοις εκατό χωρίς αποκωδικοποίηση. Το Gboard διαθέτει πολλές λειτουργίες διόρθωσης σφαλμάτων για να κάνει την πληκτρολόγηση ευκολότερη και πιο ομαλή. Αυτές οι δυνατότητες συνδυάζουν χειροκίνητες εργασίες που περιλαμβάνουν ανθρώπινη συμβολή με προληπτικές, αυτοματοποιημένες διορθώσεις.

Ολοκληρωμένα εργαλεία διόρθωσης σφαλμάτων

Η πληκτρολόγηση διευκολύνεται συνολικά από τις λειτουργίες του Gboard, οι οποίες περιλαμβάνουν τη συμπλήρωση λέξης, τις προβλέψεις επόμενης λέξης, την ενεργή αυτόματη διόρθωση (AC) και τη διόρθωση ενεργού κλειδιού (KC). Αυτά τα εργαλεία περιλαμβάνουν έξυπνη σύνθεση, διόρθωση σφαλμάτων και υποψήφιες πολλές λέξεις στη γραμμή προτάσεων ή στη γραμμή προτάσεων. Η μεταδιόρθωση (PC) διευκολύνει επίσης τη διόρθωση σφαλμάτων σε λέξεις που έχουν ήδη διαπραχθεί. Παρά αυτά τα χαρακτηριστικά, δύο βασικοί περιορισμοί βλάπτουν την εμπειρία του χρήστη.

Ενώ τα μοντέλα διόρθωσης στη συσκευή, όπως το KC, το AC και το PC είναι γρήγορα και συμπαγή, δυσκολεύονται να χειριστούν περίπλοκα και πολύπλοκα σφάλματα που χρειάζονται μεγαλύτερα περιβάλλοντα. Για να αποφευχθεί η ενεργοποίηση αυτών των μοντέλων, οι χρήστες πρέπει να πληκτρολογούν αργά και με ακρίβεια.
Η ταχύτητα πληκτρολόγησης μειώνεται λόγω του ότι οι χρήστες πρέπει να διορθώσουν με μη αυτόματο τρόπο λέξεις που έχουν δεσμευτεί χρησιμοποιώντας γραμματικούς και ορθογραφικούς ελέγχους, κάτι που μπορεί να είναι διανοητικά και οπτικά επιβαρυντικό.

Η ανάγκη για διόρθωση σφαλμάτων υψηλού επιπέδου

Οι γρήγοροι δακτυλογράφοι συχνά αγνοούν τις λέξεις που έχουν ήδη πληκτρολογήσει και συγκεντρώνονται μόνο στο πληκτρολόγιο. Από αυτό μπορεί να προκύψουν υψηλότερα ποσοστά σφάλματος, καθιστώντας αναγκαία τη χρήση προτάσεων ή μηχανισμών διόρθωσης υψηλότερου επιπέδου.

Παρουσιάζοντας το Proofread

Το Proofread επιλύει αυτά τα συχνά παράπονα προσφέροντας αξιοσημείωτες αυξήσεις παραγωγικότητας. Κάνει τη διόρθωση σφαλμάτων απλούστερη παρέχοντας διορθώσεις σε επίπεδο πρότασης και παραγράφου με ένα πάτημα.

Η τεχνολογία πίσω από τη διόρθωση

Η δυνατότητα διόρθωσης αποτελείται από τέσσερα κύρια στοιχεία: παραγωγή δεδομένων, σχεδιασμός μετρήσεων, προσαρμογή μοντέλου και υπηρεσία μοντέλων. Μαζί, όλα αυτά τα συστατικά εγγυώνται αποτελεσματικότητα. Για να διασφαλιστεί ότι η διανομή δεδομένων είναι σύμφωνη με τον τομέα Gboard, το σύστημα μιμείται συχνά σφάλματα πληκτρολογίου χρησιμοποιώντας μια ακριβή και μεθοδικά κατασκευασμένη συνθετική αρχιτεκτονική σφαλμάτων.

Προηγμένες μετρήσεις και βελτιστοποίηση μοντέλου

Για να αξιολογήσουν το μοντέλο, οι ερευνητές έχουν ενσωματώσει μια σειρά από μετρήσεις, με ιδιαίτερη έμφαση στους ελέγχους παρουσίας γραμματικών σφαλμάτων και παρόμοιους ελέγχους νοημάτων που προέρχονται από μεγάλα γλωσσικά μοντέλα (LLM). Η εποπτευόμενη λεπτομέρεια και ο συντονισμός Ενισχυμένης Μάθησης (RL) χρησιμοποιούνται στην τεχνική InstructGPT για τη βελτίωση του μοντέλου. Η απόδοση διόρθωσης του μοντέλου βελτιώνεται σημαντικά με αυτή τη διαδικασία.

Ανάπτυξη και απόδοση

Χρησιμοποιώντας κβαντισμό 8 bit, το μεσαίου μεγέθους LLM PaLM2-XS είναι προσαρμοσμένο για να χωράει σε ένα μόνο TPU v5 και χρησιμεύει ως βάση για τη δυνατότητα Διόρθωσης. Η βελτιστοποίηση μειώνει το κόστος εξυπηρέτησης. Προηγούμενη έρευνα έχει δείξει ότι η τμηματοποίηση, η κερδοσκοπική αποκωδικοποίηση και τα κλειδιά κάδου μπορούν να μειώσουν τον λανθάνοντα χρόνο.

Επίδραση στον πραγματικό κόσμο

Δεκάδες χιλιάδες χρήστες του Pixel 8 θα επωφεληθούν από τις επεξεργασίες υψηλής ποιότητας που παρέχονται από τη δυνατότητα Διόρθωσης, η οποία είναι πλέον διαθέσιμη. Μια ενδελεχής παραγωγή συνθετικών δεδομένων και αρκετές επαναλήψεις λεπτομέρειας έχουν δημιουργήσει ένα μοντέλο που μειώνει σημαντικά τα γραμματικά λάθη, όπως φαίνεται από μια σχετική μείωση κατά 5,74 τοις εκατό του Bad ratio του μοντέλου PaLM2-XS. Επιπλέον, οι βελτιστοποιήσεις οδήγησαν σε μείωση κατά 39,4% στη διάμεση καθυστέρηση.

Μελλοντικές προοπτικές

Αυτή η μελέτη δείχνει πώς τα LLM μπορούν να βελτιώσουν την εμπειρία των χρηστών και να δημιουργήσουν ενδιαφέρουσες δυνατότητες για περαιτέρω έρευνα. Η χρήση δεδομένων πραγματικού χρήστη, η πολύγλωσση υποστήριξη, η προσαρμοσμένη βοήθεια γραφής και οι λύσεις απορρήτου συσκευών είναι μερικά παραδείγματα τομέων που θα μπορούσαν να οδηγήσουν σε περαιτέρω προόδους στον τομέα.

Το Google AI επεκτείνει τις δυνατότητες της τεχνολογίας πληκτρολογίου για κινητά με την εισαγωγή της δυνατότητας Proofread, βελτιώνοντας την πληκτρολόγηση για άτομα σε όλο τον κόσμο.