Aischéimniú Líneach

Nuashonraithe ar July 25, 2024 4 Miontuairiscí Léigh

Réamhrá

Tugtar tacar sonraí $D = \{(X_{1}, Y_{2}), \dots,(X_{N}, Y_{N})\}$ mar $X_{i}$ agus $Y_{i Tá }$ leanúnach, Is é an sprioc atá le "Aischéimniú Líneach" ná an líne is fearr a aimsiú a oireann do na sonraí seo.

I bhfocail eile, ba mhaith linn an tsamhail a chruthú:

$\hat{y} = a*{0} + a*{1}.x*{1} + \dots + a*{p}.x\_{p}$

áit arb é $p$ líon toisí na hathróige $X$ .

San Airteagal seo feicfimid conas an fhadhb seo a réiteach i dtrí chás:

Nuair is aontoiseach é X, i.e. $p=1$ .
Nuair atá X iltoiseach, i.e. $p>1$ .
Ag baint úsáide as shliocht grádán.

Is tríthoiseach amháin $X$ (Gnáthchearnóg ar a laghad)

Tá cruth ar an tsamhail is mian linn a chruthú:

$\hat{y} = a*{0} + a*{1}.x$

Cuimhnigh gurb é an sprioc atá le cúlchéimniú líneach ná an líne is fearr a oireann do na sonraí a aimsiú. I bhfocail eile, ní mór dúinn an fad idir na pointí sonraí agus an líne a íoslaghdú.

$(\hat{a*{0}}, \hat{a*{1}}) = \underset{(a*{0}, a*{1})}{\operatorname{argmin}} \sum\limits*{i=1}^{N} (y*{i} - \hat{y*{i}})^2$

$= \underset{(a*{0}, a*{1})}{\operatorname{argmin}} \sum\limits*{i=1}^{N} (y*{i} - (a*{0} + a*{1}.x*{i}))^2$

Cuirimis:

$L = \sum\limits*{i=1}^{N} (y*{i} - (a*{0} + a*{1}.x\_{i}))^2$

Chun an t-íosmhéid a fháil, ní mór dúinn na cothromóidí seo a leanas a réiteach:

\begin{cases} \frac{\partial L}{\partial a_{0}} = 0\\ \frac{\partial L}{\partial a_{1}} = 0 \end{cases}

\begin{cases} \sum\limits_{i=1}^{N} -2(y_{i} - (a_{0} + a_{1}.x_{i})) = 0\\ \sum\limits_{i=1}^{N} -2x_{i}(y_{i} - (a_{0} + a_{1}.x_{i})) = 0 \end{cases}

Tosaímid tríd an gcéad chothromóid a fhorbairt:

\sum\limits_{i=1}^{N} y_{i} - \sum\limits_{i=1}^{N}a_{0} + \sum\limits_{i=1}^{N} a_{1}.x_{i} = 0\\

\sum\limits_{i=1}^{N} y_{i} - Na_{0} + \sum\limits_{i=1}^{N} a_{1}.x_{i} = 0\\

a_{0} = \frac{\sum\limits_{i=1}^{N} y_{i}}{N} - \frac{\sum\limits_{i=1}^{N} x_{i}}{N}a_{1}

a_{0} = Y - Xa_{1}

Déanaimid ionadú sa dara cothromóid:

\sum\limits_{i=1}^{N} x_{i}(y_{i} - Y + Xa_{1} - a_{1}x_{i}) = 0

\sum\limits_{i=1}^{N} (y_{i} - Y) + a_{1}(X - x_{i}) = 0

\sum\limits_{i=1}^{N} (y_{i} - Y) - \sum\limits_{i=1}^{N}a_{1}(x_{i} - X) = 0

a_{1} = \frac{\sum\limits_{i=1}^{N} (y_{i} - Y)}{\sum\limits_{i=1}^{N}(x_{i} - X)} = \frac{\sum\limits_{i=1}^{N} (y_{i} - Y)(x_{i} - X)}{\sum\limits_{i=1}^{N}(x_{i} - X)^2} = \frac{COV(X, Y)}{VAR(X)}

Déanaimid ionadach ar ais in $a_{0}$ :

\begin{cases} a_{0} = Y - X\frac{COV(X, Y)}{VAR(X)}\\ a_{1} = \frac{COV(X, Y)}{VAR(X)} \end{cases}

Tá $X$ iltoiseach (Gnáthchearnóg ar a laghad)

Sa chás seo, ní fíoruimhir í $X_{i}$ a thuilleadh, ach ina ionad sin is veicteoir é $p$ :

$X*{i} = (X*{i1},X*{i2},\dots,X*{ip})$

Mar sin, scríobhtar an tsamhail mar seo a leanas:

$\hat{y} = a*{0} + a*{1}x*{1} + a*{2}x*{2} + \dots + a*{p}x\_{p}$

nó, is féidir é a scríobh i bhformáid maitrís:

$\hat{Y} = X.W$

áit:

Is é $Y$ cruth $(N, 1)$ .
Is é $X$ cruth $(N,p)$ .
Is é $W$ cruth $(p, 1)$ : is é seo an veicteoir paraiméadair $(w_{1}, w_{2}, \dots, w_{p})$ .

Mar an gcéanna leis an gcéad chás, tá sé mar aidhm againn an méid seo a leanas a íoslaghdú:

$\hat{W} = \underset{W}{\operatorname{argmin}} \sum\limits*{i=1}^{N} (y*{i} - \hat{y\_{i}})^2$

Arís cuirimis:

$L = \sum\limits*{i=1}^{N} (y*{i} - \hat{y\_{i}})^2$

= (Y-XW)^{T}(Y-XW)

= Y^TY-Y^TXW-W^TX^TY+W^TX^TXW

= Y^TY-2W^TX^TY+W^TX^TXW

Ós rud é go dteastaíonn uainn $L$ a íoslaghdú maidir le $W$ , is féidir linn neamhaird a dhéanamh den chéad téarma " $Y^TY$ " toisc go bhfuil sé neamhspleách ar $W$ agus déanaimis an chothromóid seo a leanas a réiteach:

\frac{\partial (-2W^TX^TY+W^TX^TXW)}{\partial W} = 0

-2X^TY+2X^TX\hat{W} = 0

\hat{W} = (X^TX)^{-1}X^TY

Ag baint úsáide as shliocht grádáin

Seo foirmiú an algartam shliocht grádáin:

$w*{n+1} = w*{n} - lr \times \frac{\partial f}{\partial w\_{n}}$

Níl le déanamh againn anois ach é a chur i bhfeidhm ar an dá pharaiméadar $a_{0}$ agus $a_{1}$ (i gcás athróg amháin $X$ ):

\begin{cases} a_{0}^{(n+1)} = a_{0}^{(n)} - lr \times \frac{\partial L}{\partial a_{0}}\\ a_{1}^{(n+1)} = a_{1}^{(n)} - lr \times \frac{\partial L}{\partial a_{1}} \end{cases}

agus tá a fhios againn:

\begin{cases} \frac{\partial L}{\partial a_{0}} = \sum\limits_{i=1}^{N} -2(y_{i} - (a_{0} + a_{1}.x_{i}))\\ \frac{\partial L}{\partial a_{1}} = \sum\limits_{i=1}^{N} -2x_{i}(y_{i} - (a_{0} + a_{1}.x_{i})) \end{cases}

Trí ionadú:

\begin{cases} a_{0}^{(n+1)} = a_{0}^{(n)} + 2 \times lr \times \sum\limits_{i=1}^{N} (y_{i} - (a_{0}^{(n)} + a_{1}^{(n)}.x_{i}))\\ a_{1}^{(n+1)} = a_{1}^{(n)} + 2 \times lr \times \sum\limits_{i=1}^{N} x_{i}(y_{i} - (a_{0}^{(n)} + a_{1}^{(n)}.x_{i})) \end{cases}

Tráth na gCeist

Cad é foirmle an veicteora paraiméadair bharrfheabhsaithe i gcás aischéimnithí líneach iltoiseach:
$\frac{COV(X, Y)}{VAR(Y)}$
$\frac{COV(X, Y)}{VAR(X)}$
$(X^TX)^{-1}X^TY$ "ceart"
Cén fáth a gcuirimid an díorthach go 0?
Chun teacht ar an extremum. "ceart"
Chun an díorthach a íoslaghdú.
Gan ach an chuid fíor den díorthach a choinneáil.
Cad é cuspóir aischéimnithí líneach?
Chun an líne a théann thar na pointí go léir a fháil.
Chun an líne is fearr a chuireann síos ar na sonraí a fháil."ceart"
Chun an líne is fearr a scarann na sonraí a fháil.