Dado un conjunto de datos D={(X1,Y2),…,(XN,YN)} como Xi y Yi son continuos. El objetivo de la "regresión lineal" es encontrar la mejor línea que se ajuste a estos datos.
En otras palabras, queremos crear el modelo:
y^=a∗0+a∗1.x∗1+⋯+a∗p.x_p
donde p es el número de dimensiones de la variable X.
En este artículo veremos cómo solucionar este problema en tres escenarios:
Cuando X es unidimensional, es decir, p=1.
Cuando X es multidimensional, es decir, p>1.
Usando descenso de gradiente.
X es unidimensional (mínimos cuadrados ordinarios)
El modelo que queremos crear tiene la forma:
y^=a∗0+a∗1.x
Recuerde que el objetivo de la regresión lineal es encontrar la recta que mejor se ajuste a los datos. En otras palabras, necesitamos minimizar la distancia entre los puntos de datos y la línea.
(a∗0^,a∗1^)=(a∗0,a∗1)argmin∑∗i=1N(y∗i−y∗i^)2
=(a∗0,a∗1)argmin∑∗i=1N(y∗i−(a∗0+a∗1.x∗i))2
Pongamos:
L=∑∗i=1N(y∗i−(a∗0+a∗1.x_i))2
Para encontrar el mínimo, necesitamos resolver las siguientes ecuaciones:
X es multidimensional (mínimos cuadrados ordinarios)
En este caso, Xi ya no es un número real, sino que es un vector de tamaño p:
X∗i=(X∗i1,X∗i2,…,X∗ip)
Entonces, el modelo se escribe de la siguiente manera:
y^=a∗0+a∗1x∗1+a∗2x∗2+⋯+a∗px_p
o puede escribirse en formato matricial:
Y^=X.W
dónde:
Y tiene la forma (N,1).
X tiene la forma (N,p).
W tiene la forma (p,1): este es el vector de parámetros (w1,w2,…,wp).
De manera similar al primer caso, nuestro objetivo es minimizar la siguiente cantidad:
W^=Wargmin∑∗i=1N(y∗i−y_i^)2
Nuevamente pongamos:
L=∑∗i=1N(y∗i−y_i^)2
=(Y−XW)T(Y−XW)
=YTY−YTXW−WTXTY+WTXTXW
=YTY−2WTXTY+WTXTXW
Como queremos minimizar L con respecto a W, entonces podemos ignorar el primer término "YTY" porque es independiente de W y resolvamos la siguiente ecuación:
∂W∂(−2WTXTY+WTXTXW)=0
−2XTY+2XTXW^=0
W^=(XTX)−1XTY
Usando descenso de gradiente
Aquí está la formulación del algoritmo de descenso de gradiente:
w∗n+1=w∗n−lr×∂w_n∂f
Ahora todo lo que tenemos que hacer es aplicarlo en los dos parámetros a0 y a1 (en el caso de una variable X):
Dedicados y centrados en ti. Te ayudamos a entender, aprovechar y mostrar tus nuevas y potentes habilidades a través de revisiones de currículos, prácticas de entrevistas y debates sobre el sector.