Dat un set de date D={(X1,Y2),…,(XN,YN)} cum ar fi Xi și Yi sunt continui. Scopul „Regresiei liniare” este de a găsi cea mai bună linie care se potrivește acestor date.
Cu alte cuvinte, dorim să creăm modelul:
y^=a∗0+a∗1.x∗1+⋯+a∗p.x_p
unde p este numărul de dimensiuni ale variabilei X.
În acest articol vom vedea cum să rezolvăm această problemă în trei scenarii:
Când X este unidimensional, adică p=1.
Când X este multidimensional, adică p>1.
Utilizarea coborârii în gradient.
X este unidimensional (Cel mai mic pătrat obișnuit)
Modelul pe care vrem să-l creăm este de formă:
y^=a∗0+a∗1.x
Amintiți-vă că scopul regresiei liniare este de a găsi dreapta care se potrivește cel mai bine datelor. Cu alte cuvinte, trebuie să minimizăm distanța dintre punctele de date și linie.
(a∗0^,a∗1^)=(a∗0,a∗1)argmin∑∗i=1N(y∗i−y∗i^)2
=(a∗0,a∗1)argmin∑∗i=1N(y∗i−(a∗0+a∗1.x∗i))2
Sa punem:
L=∑∗i=1N(y∗i−(a∗0+a∗1.x_i))2
Pentru a găsi minimul, trebuie să rezolvăm următoarele ecuații:
X este multidimensional (Cel mai mic pătrat obișnuit)
În acest caz, Xi nu mai este un număr real, ci este un vector de mărimea p:
X∗i=(X∗i1,X∗i2,…,X∗ip)
Deci, modelul este scris după cum urmează:
y^=a∗0+a∗1x∗1+a∗2x∗2+⋯+a∗px_p
sau, poate fi scris într-un format de matrice:
Y^=X.W
Unde:
Y are forma (N,1).
X are forma (N,p).
W are forma (p,1): acesta este vectorul de parametri (w1,w2,…,wp).
Similar cu primul caz, ne propunem să minimizăm următoarea cantitate:
W^=Wargmin∑∗i=1N(y∗i−y_i^)2
Din nou să punem:
L=∑∗i=1N(y∗i−y_i^)2
=(Y−XW)T(Y−XW)
=YTY−YTXW−WTXTY+WTXTXW
=YTY−2WTXTY+WTXTXW
Deoarece dorim să minimizăm L în raport cu W, atunci putem ignora primul termen "YTY" deoarece este independent de W și să rezolvăm următoarea ecuație:
∂W∂(−2WTXTY+WTXTXW)=0
−2XTY+2XTXW^=0
W^=(XTX)−1XTY
Folosind coborârea gradientului
Iată formularea algoritmului de coborâre a gradientului:
w∗n+1=w∗n−lr×∂w_n∂f
Acum tot ce trebuie să facem este să o aplicăm pe cei doi parametri a0 și a1 (în cazul unei singure variabile X):
Dedicat și concentrat pe tine. Vă ajutăm să înțelegeți, să vă valorificați și să vă prezentați noile abilități puternice prin recenzii ale CV-urilor, practica interviurilor și discuții din industrie.