Μάθηση με επίβλεψη
Η μάθηση με επίβλεψη περιλαμβάνει την εκπαίδευση ενός μοντέλου σε ένα σύνολο δεδομένων με ετικέτες. Δεδομένα με ετικέτες σημαίνει ότι τα δεδομένα εισόδου αντιστοιχίζονται με τη σωστή έξοδο. Ο στόχος είναι το μοντέλο να μάθει την αντιστοίχιση ή τη σχέση μεταξύ εισόδων και εξόδων, ώστε να μπορεί να κάνει προβλέψεις ή να ταξινομήσει με ακρίβεια νέα, αθέατα δεδομένα. Υπάρχουν δύο κύριοι τύποι μάθησης με επίβλεψη:
-
Ταξινόμηση: Αυτό περιλαμβάνει την πρόβλεψη μιας κατηγορικής ετικέτας. Για παράδειγμα, ο προσδιορισμός αν ένα μήνυμα ηλεκτρονικού ταχυδρομείου είναι spam ή όχι spam με βάση ορισμένα χαρακτηριστικά (όπως οι λέξεις που χρησιμοποιούνται, ο αποστολέας κ.λπ.). Για την ταξινόμηση χρησιμοποιούνται αλγόριθμοι όπως οι μηχανές διανυσμάτων υποστήριξης (SVM), τα δέντρα αποφάσεων και τα νευρωνικά δίκτυα.
-
Παλινδρόμηση: Περιλαμβάνει την πρόβλεψη μιας συνεχούς τιμής. Για παράδειγμα, πρόβλεψη της τιμής ενός σπιτιού με βάση τα χαρακτηριστικά του, όπως το εμβαδόν, ο αριθμός των υπνοδωματίων κ.λπ. Για εργασίες παλινδρόμησης χρησιμοποιούνται αλγόριθμοι όπως η γραμμική παλινδρόμηση, το Random Forest και το Gradient Boosting.
Μάθηση χωρίς επίβλεψη
Η μάθηση χωρίς επίβλεψη περιλαμβάνει την εκπαίδευση ενός μοντέλου σε ένα σύνολο δεδομένων χωρίς ετικέτες. Εδώ, ο αλγόριθμος προσπαθεί να βρει κρυμμένα μοτίβα ή εγγενείς δομές στα δεδομένα χωρίς ρητή επίβλεψη. Στόχος είναι η εξερεύνηση των δεδομένων, η κατανόηση της δομής τους και η εξαγωγή σημαντικών πληροφοριών. Οι συνήθεις τύποι μάθησης χωρίς επίβλεψη περιλαμβάνουν:
-
Συσταδοποίηση: Ομαδοποίηση παρόμοιων σημείων δεδομένων με βάση ορισμένα χαρακτηριστικά ή ομοιότητες. Για παράδειγμα, ομαδοποίηση τμημάτων πελατών με βάση την αγοραστική τους συμπεριφορά χρησιμοποιώντας αλγορίθμους όπως ο K-Means ή η Ιεραρχική ομαδοποίηση.
-
Μείωση διαστάσεων: Μείωση του αριθμού των χαρακτηριστικών με παράλληλη διατήρηση των βασικών πληροφοριών. Η Ανάλυση Κύριων Συνιστωσών (PCA) και η Ενσωμάτωση Στοχαστικών Γειτόνων με κατανομή t (t-SNE) χρησιμοποιούνται για την απεικόνιση δεδομένων υψηλής διάστασης σε χώρο χαμηλότερης διάστασης.
Πότε να χρησιμοποιήσετε το καθένα
-
Η επιβλεπόμενη μάθηση χρησιμοποιείται όταν έχετε επισημειωμένα δεδομένα και θέλετε να προβλέψετε ή να ταξινομήσετε μελλοντικές περιπτώσεις με βάση αυτά τα επισημειωμένα δεδομένα. Για παράδειγμα, εάν έχετε ιστορικά δεδομένα σχετικά με τις αγορές πελατών και θέλετε να προβλέψετε μελλοντικές αγορές, η μάθηση με επίβλεψη είναι κατάλληλη.
-
Η μάθηση χωρίς επίβλεψη χρησιμοποιείται όταν δεν έχετε δεδομένα με ετικέτες ή όταν θέλετε να εξερευνήσετε και να κατανοήσετε την υποκείμενη δομή των δεδομένων. Για παράδειγμα, στην ανίχνευση ανωμαλιών ή στην εύρεση κρυμμένων μοτίβων σε μεγάλα σύνολα δεδομένων.
Μερικές φορές, ένας συνδυασμός και των δύο τύπων μάθησης, γνωστός ως μάθηση με ημι-επίβλεψη, μπορεί να χρησιμοποιηθεί όταν έχετε ένα μικρό ποσό δεδομένων με ετικέτες και ένα μεγάλο ποσό δεδομένων χωρίς ετικέτες, επιτρέποντας στα μοντέλα να επωφεληθούν και από τις δύο πηγές πληροφοριών.