Adott egy D={(X1,Y2),…,(XN,YN)} adatkészlet, például Xi és YiA folyamatos, A "Lineáris regresszió" célja az adatokhoz illeszkedő legjobb vonal megtalálása.
Más szavakkal, a modellt szeretnénk létrehozni:
y^=a∗0+a∗1.x∗1+⋯+a∗p.x_p
ahol p a X változó dimenzióinak száma.
Ebben a cikkben meglátjuk, hogyan lehet megoldani ezt a problémát három forgatókönyv szerint:
Ha X egydimenziós, azaz p=1.
Ha X többdimenziós, azaz p>1.
Gradiens süllyedés használata.
X egydimenziós (közönséges legkisebb négyzet)
A létrehozni kívánt modell a következő alakú:
y^=a∗0+a∗1.x
Ne feledje, hogy a lineáris regresszió célja az adatokhoz legjobban illeszkedő egyenes megtalálása. Más szóval, minimalizálnunk kell az adatpontok és a vonal közötti távolságot.
(a∗0^,a∗1^)=(a∗0,a∗1)argmin∑∗i=1N(y∗i−y∗i^)2
=(a∗0,a∗1)argmin∑∗i=1N(y∗i−(a∗0+a∗1.x∗i))2
Tegyük fel:
L=∑∗i=1N(y∗i−(a∗0+a∗1.x_i))2
A minimum meghatározásához a következő egyenleteket kell megoldanunk:
Ebben az esetben a Xi már nem valós szám, hanem egy p méretű vektor:
X∗i=(X∗i1,X∗i2,…,X∗ip)
Tehát a modell a következőképpen van írva:
y^=a∗0+a∗1x∗1+a∗2x∗2+⋯+a∗px_p
vagy mátrix formátumban is írható:
Y^=X.W
ahol:
Y(N,1) alakú.
X(N,p) alakú.
A W(p,1) alakú: ez a (w1,w2,…,wp) paramétervektor.
Az első esethez hasonlóan a következő mennyiség minimalizálására törekszünk:
W^=Wargmin∑∗i=1N(y∗i−y_i^)2
Tegyük fel még egyszer:
L=∑∗i=1N(y∗i−y_i^)2
=(Y−XW)T(Y−XW)
=YTY−YTXW−WTXTY+WTXTXW
=YTY−2WTXTY+WTXTXW
Mivel a L-t szeretnénk minimalizálni a W-hoz képest, ezért figyelmen kívül hagyhatjuk az első "YTY" tagot, mert független a W-tól, és oldjuk meg a következő egyenletet:
∂W∂(−2WTXTY+WTXTXW)=0
−2XTY+2XTXW^=0
W^=(XTX)−1XTY
Gradiens süllyedés használata
Íme a gradiens süllyedés algoritmusának megfogalmazása:
w∗n+1=w∗n−lr×∂w_n∂f
Most már csak annyit kell tennünk, hogy alkalmazzuk a két paraméterre: a0 és a1 (egy változó esetén: X):
Odaadóan és rád összpontosítva. Az önéletrajzok áttekintésén, az interjúk gyakorlatán és az iparági megbeszéléseken keresztül segítünk megérteni, kihasználni és bemutatni erőteljes új készségeit.