Étant donné un ensemble de données D={(X1,Y2),…,(XN,YN)} tel que Xi et Yi sont continus, le but de la « régression linéaire » est de trouver la meilleure ligne qui correspond à ces données.
En d’autres termes, nous voulons créer le modèle :
y^=a∗0+a∗1.x∗1+⋯+a∗p.x_p
où p est le nombre de dimensions de la variable X.
Dans cet article, nous verrons comment résoudre ce problème dans trois scénarios :
Lorsque X est unidimensionnel c'est-à-dire p=1.
Lorsque X est multidimensionnel c'est-à-dire p>1.
Utilisation de la descente de gradient.
X est unidimensionnel (moindres carrés ordinaires)
Le modèle que l'on souhaite créer est de forme :
y^=a∗0+a∗1.x
N'oubliez pas que le but de la régression linéaire est de trouver la droite qui correspond le mieux aux données. En d’autres termes, nous devons minimiser la distance entre les points de données et la ligne.
(a∗0^,a∗1^)=(a∗0,a∗1)argmin∑∗i=1N(y∗i−y∗i^)2
=(a∗0,a∗1)argmin∑∗i=1N(y∗i−(a∗0+a∗1.x∗i))2
Mettons:
L=∑∗i=1N(y∗i−(a∗0+a∗1.x_i))2
Afin de trouver le minimum, nous devons résoudre les équations suivantes :
X est multidimensionnel (moindres carrés ordinaires)
Dans ce cas, Xi n'est plus un nombre réel, mais plutôt un vecteur de taille p :
X∗i=(X∗i1,X∗i2,…,X∗ip)
Ainsi, le modèle s’écrit comme suit :
y^=a∗0+a∗1x∗1+a∗2x∗2+⋯+a∗px_p
ou, il peut être écrit sous forme matricielle :
Y^=X.W
où:
Y est de forme (N,1).
X est de forme (N,p).
W est de forme (p,1) : c'est le vecteur de paramètres (w1,w2,…,wp).
De la même manière que dans le premier cas, nous visons à minimiser la quantité suivante :
W^=Wargmin∑∗i=1N(y∗i−y_i^)2
Mettons encore :
L=∑∗i=1N(y∗i−y_i^)2
=(Y−XW)T(Y−XW)
=YTY−YTXW−WTXTY+WTXTXW
=YTY−2WTXTY+WTXTXW
Puisque nous voulons minimiser L par rapport à W, alors nous pouvons ignorer le premier terme « YTY » car il est indépendant de W et résolvons l'équation suivante :
∂W∂(−2WTXTY+WTXTXW)=0
−2XTY+2XTXW^=0
W^=(XTX)−1XTY
Utiliser la descente de gradient
Voici la formulation de l’algorithme de descente de gradient :
w∗n+1=w∗n−lr×∂w_n∂f
Il ne reste plus qu'à l'appliquer sur les deux paramètres a0 et a1 (dans le cas d'une seule variable X) :
Dédié et concentré sur vous. Nous vous aidons à comprendre, exploiter et mettre en valeur vos nouvelles compétences puissantes grâce à des examens de CV, des pratiques d'entretien et des discussions sur l'industrie.