Gegeven een dataset D={(X1,Y2),…,(XN,YN)} zoals Xi en Yi zijn continu. Het doel van "Lineaire regressie" is om de beste lijn te vinden die bij deze gegevens past.
Met andere woorden, we willen het model maken:
y^=a∗0+a∗1.x∗1+⋯+a∗p.x_p
waarbij p het aantal dimensies van de variabele X is.
In dit artikel zullen we zien hoe we dit probleem in drie scenario’s kunnen oplossen:
Wanneer X eendimensionaal is, d.w.z. p=1.
Wanneer X multidimensionaal is, d.w.z. p>1.
Gebruik van gradiëntafdaling.
X is eendimensionaal (gewoon kleinste kwadraat)
Het model dat we willen maken heeft een vorm:
y^=a∗0+a∗1.x
Bedenk dat het doel van lineaire regressie is om de lijn te vinden die het beste bij de gegevens past. Met andere woorden, we moeten de afstand tussen de gegevenspunten en de lijn minimaliseren.
(a∗0^,a∗1^)=(a∗0,a∗1)argmin∑∗i=1N(y∗i−y∗i^)2
=(a∗0,a∗1)argmin∑∗i=1N(y∗i−(a∗0+a∗1.x∗i))2
Laten we:
L=∑∗i=1N(y∗i−(a∗0+a∗1.x_i))2
Om het minimum te vinden, moeten we de volgende vergelijkingen oplossen:
In dit geval is Xi niet langer een reëel getal, maar in plaats daarvan is het een vector met de grootte p:
X∗i=(X∗i1,X∗i2,…,X∗ip)
Het model is dus als volgt geschreven:
y^=a∗0+a∗1x∗1+a∗2x∗2+⋯+a∗px_p
of het kan in een matrixformaat worden geschreven:
Y^=X.W
waar:
Y heeft de vorm (N,1).
X heeft de vorm (N,p).
W heeft de vorm (p,1): dit is de parametervector (w1,w2,…,wp).
Net als in het eerste geval streven we ernaar de volgende hoeveelheid te minimaliseren:
W^=Wargmin∑∗i=1N(y∗i−y_i^)2
Laten we nogmaals stellen:
L=∑∗i=1N(y∗i−y_i^)2
=(Y−XW)T(Y−XW)
=YTY−YTXW−WTXTY+WTXTXW
=YTY−2WTXTY+WTXTXW
Omdat we L willen minimaliseren ten opzichte van W, kunnen we de eerste term "YTY" negeren omdat deze onafhankelijk is van W en laten we de volgende vergelijking oplossen:
∂W∂(−2WTXTY+WTXTXW)=0
−2XTY+2XTXW^=0
W^=(XTX)−1XTY
Gradiëntafdaling gebruiken
Hier is de formulering van het algoritme voor gradiëntafdaling:
w∗n+1=w∗n−lr×∂w_n∂f
Nu hoeven we het alleen maar toe te passen op de twee parameters a0 en a1 (in het geval van één variabele X):
Toegewijd en gericht op jou. We helpen je om je krachtige nieuwe vaardigheden te begrijpen, te benutten en te laten zien door middel van cv-beoordelingen, sollicitatiegesprekken en gesprekken in de sector.