Gradiënt afkoms

diep leer
wiskunde
gradiënt afkoms
Gradiënt afkoms cover image

Inleiding

Stel jou voor dat ons 'n funksie f(x)f(x) het en ons wil graag die minimum daarvan vind. Wat sou jy doen?

Eenvoudig reg? Ons hoef net die volgende vergelyking op te los:

f(x)=0f'(x) = 0

Die ding is dat dit nie altyd maklik is om die formule van ff' te vind nie, want dit is geneig om uiters ingewikkeld te wees, veral in diep leer waar ons met komplekse funksies te doen het. Ons moet dus 'n ander metode vind wat ons die minimum van 'n funksie kan verskaf sonder dat ons die formule van die afgeleide ff' hoef te vind.

Kom ons bou 'n bietjie intuïsie

Kom ons veronderstel dat ons 'n funksie f het met die ooreenstemmende grafiek:

Graph 1

Kom ons begin met 'n ewekansige punt x0x_{0}. Die doel is om hierdie punt te skuif en dit nader en nader aan xx* te maak sodat f(f'(x*)=0) = 0. Die probleem kan dus in twee dele verdeel word:

  • In watter rigting moet ons die punt xx skuif? Links of Regs?

  • Hoeveel moet ons dit skuif?

Die rigting

Kom ons bou 'n bietjie intuïsie om die eerste vraag te beantwoord. Kyk bietjie na die volgende punt:

Graph 2

Graph 3

Let daarop dat:

  • wanneer die punt x0x_{0} regs van die optimale punt xx* is, gaan sy raaklyn op.

  • wanneer die punt x0x_{0} regs van die optimale punt xx* is, gaan sy raaklyn af.

Die rigting van 'n lyn word bepaal deur die teken van sy helling:

  • 'n Lyn gaan op \impliseer\impliseer die helling aa is positief.

  • 'n Lyn gaan af \impliseer\impliseer die helling aa is negatief.

Let daarop dat: \

Die helling van die raaklyn van 'n funksie in 'n sekere punt x0x_{0} is nie meer as die afgeleide in daardie punt f(x0)f'(x_{0}) nie:

tangent(x0):g(x)=f(x0).(xx0)+f(x0)tangent(x*{0}): g(x) = f'(x*{0}).(x-x*{0}) + f(x*{0})

So as 'n antwoord op die vraag "Waarheen moet ons x0x_{0} skuif?":

  • f(x0)<0f'(x_{0}) < 0     \implies x0x_{0} regs van xx*     \implies Ons moet x0x_{0} na links skuif.

  • f(x0)>0f'(x_{0}) > 0     \implies x0x_{0} aan die linkerkant van xx*     \implies Ons moet x0x_{0} na regs skuif.

Die stappe

Nou vir die tweede vraag, Hoeveel moet ons x0x_{0} skuif?

Kyk na die volgende voorbeelde:

Graph 4

Graph 5

Ons kan aflei dat:

  • x0x_{0} is naby aan xx* => Die helling van die raaklyn is klein => f(x0)f'(x_{0}) is klein.

  • x0x_{0} is ver van xx* => Die helling van die raaklyn is groot => f(x0)f'(x_{0}) is groot.

Deur beide vrae te beantwoord, het ons tot die gevolgtrekking gekom dat slegs die kennis van die afgeleide in die punt x0x_{0} ons baie insig kan gee oor die rigting en die afstand van die optimale punt x0x_{0}.

Gradiënt afkoms

Gradiënt afkoms is die formulering van die antwoorde van die vorige twee vrae. Dit is 'n iteratiewe optimeringsalgoritme wat die minimum xx* van funksie benader vanaf 'n ewekansige beginpunt x0x_{0}. Die algoritme word soos volg gestel:

xn+1=xnlr×dfdx_nx*{n+1} = x*{n} - lr \times \frac{\mathrm{d} f}{\mathrm{d} x\_{n}}

waar:

  • dfdxn\frac{\mathrm{d} f}{\mathrm{d} x*{n}} is nie meer as die afgeleide van ff in die punt xnx*{n} nie.

  • lrlr is 'n positiewe konstante wat bepaal hoe groot die stappe gaan wees.

Let daarop dat:

  • xnx_{n} is regs van xx* => dfdxn>0\frac{\mathrm{d} f}{\mathrm{d} x_{n}} > 0 => xn+1=xnpositiefx_{n+ 1} = x_{n} - positief => xnx_{n} beweeg na links.

  • xnx_{n} is aan die linkerkant van xx* => dfdxn<0\frac{\mathrm{d} f}{\mathrm{d} x_{n}} < 0 => xn+1=xn+positiewex*{n +1} = x*{n} + positiewe => xnx_{n} skuif na regs.

  • xnx_{n} naby aan xx* => dfdxn\frac{\mathrm{d} f}{\mathrm{d} x_{n}} naby aan 00 => Klein opdatering na xnx_{ n}.

Vasvra

  • Wanneer hou gradiënt afkoms op om te herhaal:

  • Wanneer xnx_{n} klein genoeg is.

  • Wanneer xnx_{n} naby aan x0x_{0} is.

  • Wanneer dfdx_n=0\frac{\mathrm{d} f}{\mathrm{d} x\_{n}} = 0 . XXX

  • Hoe kies ons x0x_{0}:

  • Ons kies dit lukraak. XXX

  • Ons neem dit in die omgewing van xnx{n}.

  • Dit hang af van die probleem.

  • Hoekom het ons gradiënt afkoms nodig:

  • Omdat rekenaars nie kragtig genoeg is om afgeleides te bereken nie.

  • Omdat dit uiters moeilik is om die afgeleide formules van diepleermodelle te vind. XXX

  • Omdat funksies meer as een plaaslike minimum het.


Career Services background pattern

Loopbaandienste

Contact Section background image

Kom ons bly in kontak

Code Labs Academy © 2025 Alle regte voorbehou.