Biorąc pod uwagę zbiór danych D={(X1,Y2),…,(XN,YN)}, taki jak Xi i Yi są ciągłe. Celem „regresji liniowej” jest znalezienie najlepszej linii pasującej do tych danych.
Innymi słowy, chcemy stworzyć model:
y^=a∗0+a∗1.x∗1+⋯+a∗p.x_p
gdzie p jest liczbą wymiarów zmiennej X.
W tym artykule zobaczymy, jak rozwiązać ten problem w trzech scenariuszach:
Gdy X jest jednowymiarowe, tj. p=1.
Gdy X jest wielowymiarowe, tj. p>1.
Korzystanie ze zjazdu gradientowego.
X jest jednowymiarowe (zwykła metoda najmniejszych kwadratów)
Model który chcemy stworzyć ma kształt:
y^=a∗0+a∗1.x
Pamiętaj, że celem regresji liniowej jest znalezienie linii, która najlepiej pasuje do danych. Innymi słowy, musimy zminimalizować odległość między punktami danych a linią.
(a∗0^,a∗1^)=(a∗0,a∗1)argmin∑∗i=1N(y∗i−y∗i^)2
=(a∗0,a∗1)argmin∑∗i=1N(y∗i−(a∗0+a∗1.x∗i))2
Włóżmy:
L=∑∗i=1N(y∗i−(a∗0+a∗1.x_i))2
Aby znaleźć minimum, musimy rozwiązać następujące równania:
X jest wielowymiarowe (zwykła metoda najmniejszych kwadratów)
W tym przypadku Xi nie jest już liczbą rzeczywistą, ale zamiast tego jest wektorem o rozmiarze p:
X∗i=(X∗i1,X∗i2,…,X∗ip)
Zatem wzór zapisuje się w następujący sposób:
y^=a∗0+a∗1x∗1+a∗2x∗2+⋯+a∗px_p
lub można to zapisać w formacie macierzowym:
Y^=X.W
Gdzie:
Y ma kształt (N,1).
X ma kształt (N,p).
W ma kształt (p,1): jest to wektor parametrów (w1,w2,…,wp).
Podobnie jak w pierwszym przypadku dążymy do minimalizacji następującej wielkości:
W^=Wargmin∑∗i=1N(y∗i−y_i^)2
Znów postawmy:
L=∑∗i=1N(y∗i−y_i^)2
=(Y−XW)T(Y−XW)
=YTY−YTXW−WTXTY+WTXTXW
=YTY−2WTXTY+WTXTXW
Ponieważ chcemy zminimalizować L względem W, możemy zignorować pierwszy wyraz „YTY”, ponieważ jest on niezależny od W i rozwiążemy następujące równanie:
∂W∂(−2WTXTY+WTXTXW)=0
−2XTY+2XTXW^=0
W^=(XTX)−1XTY
Używanie opadania gradientowego
Oto sformułowanie algorytmu opadania gradientowego:
w∗n+1=w∗n−lr×∂w_n∂f
Teraz wystarczy zastosować to do dwóch parametrów a0 i a1 (w przypadku jednej zmiennej X):
Dedykowane i skoncentrowane na Tobie. Pomagamy zrozumieć, wykorzystać i zaprezentować nowe, potężne umiejętności poprzez przegląd CV, praktykę rozmów kwalifikacyjnych i dyskusje branżowe.