Diberikan kumpulan data D={(X1,Y2),…,(XN,YN)} seperti Xi dan Yi bersifat kontinu, Tujuan dari "Regresi Linier" adalah menemukan garis terbaik yang sesuai dengan data ini.
Dengan kata lain, kami ingin membuat model:
y^=a∗0+a∗1.x∗1+⋯+a∗p.x_p
dimana p adalah jumlah dimensi variabel X.
Pada artikel ini kita akan melihat cara mengatasi masalah ini dalam tiga skenario:
Ketika X adalah satu dimensi yaitu p=1.
Ketika X multidimensi yaitu p>1.
Menggunakan penurunan gradien.
X adalah satu dimensi (Kuadrat Terkecil Biasa)
Model yang ingin kita buat berbentuk:
y^=a∗0+a∗1.x
Ingatlah bahwa tujuan regresi linier adalah menemukan garis yang paling sesuai dengan data. Dengan kata lain, kita perlu meminimalkan jarak antara titik data dan garis.
(a∗0^,a∗1^)=(a∗0,a∗1)argmin∑∗i=1N(y∗i−y∗i^)2
=(a∗0,a∗1)argmin∑∗i=1N(y∗i−(a∗0+a∗1.x∗i))2
Katakanlah:
L=∑∗i=1N(y∗i−(a∗0+a∗1.x_i))2
Untuk mencari nilai minimum, kita perlu menyelesaikan persamaan berikut:
Dalam hal ini, Xi bukan lagi bilangan real, melainkan vektor dengan ukuran p:
X∗i=(X∗i1,X∗i2,…,X∗ip)
Jadi, modelnya ditulis sebagai berikut:
y^=a∗0+a∗1x∗1+a∗2x∗2+⋯+a∗px_p
atau dapat ditulis dalam format matriks:
Y^=X.W
Di mana:
Y berbentuk (N,1).
X berbentuk (N,p).
W berbentuk (p,1): ini adalah vektor parameter (w1,w2,…,wp).
Mirip dengan kasus pertama, kami bertujuan untuk meminimalkan kuantitas berikut:
W^=Wargmin∑∗i=1N(y∗i−y_i^)2
Sekali lagi mari kita katakan:
L=∑∗i=1N(y∗i−y_i^)2
=(Y−XW)T(Y−XW)
=YTY−YTXW−WTXTY+WTXTXW
=YTY−2WTXTY+WTXTXW
Karena kita ingin meminimalkan L terhadap W, maka kita dapat mengabaikan suku pertama "YTY" karena tidak bergantung pada W dan mari selesaikan persamaan berikut:
∂W∂(−2WTXTY+WTXTXW)=0
−2XTY+2XTXW^=0
W^=(XTX)−1XTY
Menggunakan penurunan gradien
Berikut rumusan algoritma penurunan gradien:
w∗n+1=w∗n−lr×∂w_n∂f
Sekarang yang harus kita lakukan adalah menerapkannya pada dua parameter a0 dan a1 (dalam kasus satu variabel X):
Berdedikasi dan fokus pada Anda. Kami membantu Anda memahami, memanfaatkan, dan menunjukkan keterampilan baru Anda yang hebat melalui tinjauan resume, praktik wawancara, dan diskusi industri.