Δεδομένου ενός συνόλου δεδομένων D={(X1,Y2),…,(XN,YN)} όπως Xi και Yi είναι συνεχείς, Ο στόχος της "Γραμμικής παλινδρόμησης" είναι να βρεθεί η καλύτερη γραμμή που ταιριάζει σε αυτά τα δεδομένα.
Με άλλα λόγια, θέλουμε να δημιουργήσουμε το μοντέλο:
y^=a∗0+a∗1.x∗1+⋯+a∗p.x_p
όπου p είναι ο αριθμός των διαστάσεων της μεταβλητής X.
Σε αυτό το άρθρο θα δούμε πώς να λύσουμε αυτό το πρόβλημα σε τρία σενάρια:
Όταν το X είναι μονοδιάστατο, δηλαδή p=1.
Όταν το X είναι πολυδιάστατο, δηλαδή p>1.
Χρήση κλίσης κατάβασης.
Το ## X είναι μονοδιάστατο (Κανονικό ελάχιστο τετράγωνο)
Το μοντέλο που θέλουμε να δημιουργήσουμε έχει σχήμα:
y^=a∗0+a∗1.x
Θυμηθείτε ότι ο στόχος της γραμμικής παλινδρόμησης είναι να βρεθεί η γραμμή που ταιριάζει καλύτερα στα δεδομένα. Με άλλα λόγια, πρέπει να ελαχιστοποιήσουμε την απόσταση μεταξύ των σημείων δεδομένων και της γραμμής.
(a∗0^,a∗1^)=(a∗0,a∗1)argmin∑∗i=1N(y∗i−y∗i^)2
=(a∗0,a∗1)argmin∑∗i=1N(y∗i−(a∗0+a∗1.x∗i))2
Ας βάλουμε:
L=∑∗i=1N(y∗i−(a∗0+a∗1.x_i))2
Για να βρούμε το ελάχιστο, πρέπει να λύσουμε τις παρακάτω εξισώσεις:
Το ## X είναι πολυδιάστατο (Κανονικό ελάχιστο τετράγωνο)
Σε αυτήν την περίπτωση, το Xi δεν είναι πλέον πραγματικός αριθμός, αλλά είναι ένα διάνυσμα μεγέθους p:
X∗i=(X∗i1,X∗i2,…,X∗ip)
Έτσι, το μοντέλο γράφεται ως εξής:
y^=a∗0+a∗1x∗1+a∗2x∗2+⋯+a∗px_p
ή, μπορεί να γραφτεί σε μορφή matrix:
Y^=X.W
που:
Το Y έχει σχήμα (N,1).
Το X έχει σχήμα (N,p).
Το W έχει σχήμα (p,1): αυτό είναι το διάνυσμα παραμέτρων (w1,w2,…,wp).
Όπως και στην πρώτη περίπτωση, στοχεύουμε να ελαχιστοποιήσουμε την ακόλουθη ποσότητα:
W^=Wargmin∑∗i=1N(y∗i−y_i^)2
Και πάλι ας βάλουμε:
L=∑∗i=1N(y∗i−y_i^)2
=(Y−XW)T(Y−XW)
=YTY−YTXW−WTXTY+WTXTXW
=YTY−2WTXTY+WTXTXW
Εφόσον θέλουμε να ελαχιστοποιήσουμε το L σε σχέση με το W, τότε μπορούμε να αγνοήσουμε τον πρώτο όρο "YTY" επειδή είναι ανεξάρτητος από το W και ας λύσουμε την ακόλουθη εξίσωση:
∂W∂(−2WTXTY+WTXTXW)=0
−2XTY+2XTXW^=0
W^=(XTX)−1XTY
Χρήση gradient descent
Εδώ είναι η διατύπωση του αλγόριθμου gradient descent:
w∗n+1=w∗n−lr×∂w_n∂f
Τώρα το μόνο που έχουμε να κάνουμε είναι να το εφαρμόσουμε στις δύο παραμέτρους a0 και a1 (στην περίπτωση μιας μεταβλητής X):
Αφοσιωμένη και επικεντρωμένη σε εσάς. Σας βοηθάμε να κατανοήσετε, να αξιοποιήσετε και να αναδείξετε τις νέες ισχυρές δεξιότητές σας μέσω της εξέτασης βιογραφικών σημειωμάτων, της εξάσκησης σε συνεντεύξεις και των συζητήσεων στον κλάδο.