Καταστροφική Λήθη στη Μηχανική Μάθηση

ML
Επιστήμη Δεδομένων
Καταστροφική Λήθη στη Μηχανική Μάθηση cover image

Η Καταστροφική Λήθη, γνωστή και ως Καταστροφική Παρέμβαση, είναι ένα φαινόμενο που συμβαίνει όταν ένα μοντέλο νευρωνικού δικτύου ή μηχανικής μάθησης «ξεχνάει» ή μειώνει δραματικά την απόδοσή του σε εργασίες που είχαν μάθει προηγουμένως μετά την εκμάθηση μιας νέας εργασίας. Αυτό μπορεί να συμβεί όταν εκπαιδεύετε ένα μοντέλο σε μια ροή εργασιών, αντί να το εκπαιδεύετε σε όλες τις εργασίες ταυτόχρονα.

Υπάρχουν μερικοί διαφορετικοί τρόποι με τους οποίους μπορεί να συμβεί καταστροφική λήθη. Ένας τρόπος είναι μέσω της διαδικασίας "overfitting" 1, όπου το μοντέλο επικεντρώνεται τόσο στην προσαρμογή των δεδομένων εκπαίδευσης για η νέα εργασία ότι ξεχνά τις πληροφορίες από τις προηγούμενες εργασίες. Ένας άλλος τρόπος είναι μέσω της διαδικασίας «παρέμβασης», όπου η νέα εργασία σχετίζεται με τις προηγούμενες εργασίες κατά κάποιο τρόπο, και η εκμάθηση του μοντέλου για τη νέα εργασία «παρεμβαίνει» στις γνώσεις του για τις προηγούμενες εργασίες. Ένας συνηθισμένος τρόπος με τον οποίο εμφανίζεται η Καταστροφική Λήθη είναι όταν εκπαιδεύετε ένα μοντέλο χρησιμοποιώντας την προσέγγιση "Online Learning" 2, στην οποία το μοντέλο ενημερώνεται συνεχώς με νέα παραδείγματα καθώς έρχονται, αντί να εκπαιδεύονται σε ένα σταθερό σύνολο παραδειγμάτων ταυτόχρονα. Σε αυτό το σενάριο, το μοντέλο μπορεί να παρουσιαστεί με νέα παραδείγματα που είναι σημαντικά διαφορετικά από τα παραδείγματα στα οποία είχε εκπαιδευτεί προηγουμένως και αυτό μπορεί να το κάνει να "ξεχάσει" ή να υποβαθμίσει σημαντικά την απόδοσή του στην προηγούμενη εργασία.

Υπάρχουν διάφοροι τρόποι για να μετριαστείτε η καταστροφική λήθη:

  • Μια προσέγγιση είναι η χρήση τεχνικών όπως η "Ρύθμιση βάρους" 3, οι οποίες μπορούν να βοηθήσουν στην πρόληψη του μοντέλου από τη δραστική αλλαγή των τιμών του βάρους του και την απώλεια της γνώσης που έχει αποκτήσει από προηγούμενες εργασίες.

  • Η "Ελαστική ενοποίηση βάρους" 4, η οποία περιλαμβάνει την προσθήκη μικρής ποσότητας θορύβου στα βάρη του δικτύου κατά τη διάρκεια της προπόνησης, μπορεί επίσης να βοηθήσει στην πρόληψη της Καταστροφικής Λήθης. Αυτός ο θόρυβος βοηθά στη «σταθεροποίηση» των βαρών, καθιστώντας λιγότερο πιθανό το μοντέλο να ξεχάσει τις γνώσεις του για προηγούμενες εργασίες.

  • Μια άλλη προσέγγιση είναι η χρήση μεθόδων όπως το "Rehearsal" 5, στο οποίο το μοντέλο παρουσιάζεται συνεχώς με παραδείγματα από εργασίες που έχουν μάθει προηγουμένως για να το βοηθήσουν να διατηρήσει αυτή τη γνώση.

  • Μια άλλη δημοφιλής μέθοδος για την αντιμετώπιση της Καταστροφικής Λήθης είναι η χρήση της "Μάθησης Μεταφοράς" 6, στην οποία ένα μοντέλο εκπαιδευμένος σε μία εργασία είναι τελειοποιημένος σε μια σχετική εργασία. Για παράδειγμα, ένα μοντέλο που έχει εκπαιδευτεί να αναγνωρίζει εικόνες σκύλων μπορεί να βελτιωθεί ώστε να αναγνωρίζει εικόνες γατών. Σε αυτήν την περίπτωση, το μοντέλο έχει ήδη μάθει πολλά χαρακτηριστικά που είναι χρήσιμα για την αναγνώριση εικόνων ζώων γενικά, επομένως μπορεί να χρησιμοποιήσει αυτή τη γνώση για να μάθει γρήγορα να αναγνωρίζει εικόνες γατών.

  • Οι "Μέθοδοι συνόλου" 7, στις οποίες πολλά μοντέλα εκπαιδεύονται για την επίλυση διαφορετικών εργασιών και τα αποτελέσματα τους συνδυάζονται για να κάνουν μια τελική πρόβλεψη, είναι επίσης χρήσιμες σε πρόληψη της καταστροφικής λήθης. Για παράδειγμα, ένα μοντέλο συνόλου μπορεί να αποτελείται από ένα μοντέλο που είναι εκπαιδευμένο να αναγνωρίζει εικόνες σκύλων, ένα άλλο μοντέλο που είναι εκπαιδευμένο να αναγνωρίζει εικόνες γατών και ούτω καθεξής. Όταν παρουσιάζεται με ένα νέο παράδειγμα, το μοντέλο συνόλου μπορεί να χρησιμοποιήσει την έξοδο καθενός από τα συστατικά του μοντέλα για να κάνει μια πιο ενημερωμένη πρόβλεψη.

Η καταστροφική λήθη είναι μια σημαντική παράμετρος κατά την εκπαίδευση μοντέλων μηχανικής εκμάθησης, ειδικά όταν αυτά τα μοντέλα εκπαιδεύονται ώστε να μαθαίνουν πολλαπλές εργασίες με την πάροδο του χρόνου. Με τη χρήση τεχνικών όπως η ρύθμιση βάρους, η ελαστική ενοποίηση βάρους, η πρόβα, η εκμάθηση μεταφοράς και οι μέθοδοι συνόλου, είναι δυνατό να μετριαστούν οι επιπτώσεις της καταστροφικής λήθης και να βελτιωθεί η απόδοση των μοντέλων μηχανικής μάθησης.


Μετατρέψτε τα σύνθετα δεδομένα σε χρήσιμες πληροφορίες—εγγραφείτε στο Code Labs Academy του Data Science & AI Bootcamp για να αποκτήσετε πρόσβαση στο πλήρες δυναμικό της μηχανικής μάθησης και της τεχνητής νοημοσύνης.


[1] The Overfitting Iceberg (2020)

[2] Διαδικτυακές Μέθοδοι στη Μηχανική Μάθηση - Θεωρία και Εφαρμογές (Συμβουλευτείτε τον Ιανουάριο του 2023)

[3] Τεχνικές Regularization in Deep Learning (2019)

[4] Ξεπερνώντας την καταστροφική λήθη στα νευρωνικά δίκτυα (2017)

[5] Catastrophic Forgetting, Rehearsal and Pseudorehearsal (1995)

[6] A Survey of Transfer Learning (2016)

[7] Ensemble Learning - Wikipedia (Συμβουλή τον Ιανουάριο του 2023)


Career Services background pattern

Υπηρεσίες καριέρας

Contact Section background image

Ας μείνουμε σε επαφή

Code Labs Academy © 2024 Όλα τα δικαιώματα διατηρούνται.