Inleiding
Stel jou voor dat ons 'n funksie het en ons wil graag die minimum daarvan vind. Wat sou jy doen?
Eenvoudig reg? Ons hoef net die volgende vergelyking op te los:
Die ding is dat dit nie altyd maklik is om die formule van te vind nie, want dit is geneig om uiters ingewikkeld te wees, veral in diep leer waar ons met komplekse funksies te doen het. Ons moet dus 'n ander metode vind wat ons die minimum van 'n funksie kan verskaf sonder dat ons die formule van die afgeleide hoef te vind.
Kom ons bou 'n bietjie intuïsie
Kom ons veronderstel dat ons 'n funksie f het met die ooreenstemmende grafiek:
Kom ons begin met 'n ewekansige punt . Die doel is om hierdie punt te skuif en dit nader en nader aan te maak sodat x*. Die probleem kan dus in twee dele verdeel word:
-
In watter rigting moet ons die punt skuif? Links of Regs?
-
Hoeveel moet ons dit skuif?
Die rigting
Kom ons bou 'n bietjie intuïsie om die eerste vraag te beantwoord. Kyk bietjie na die volgende punt:
Let daarop dat:
-
wanneer die punt regs van die optimale punt is, gaan sy raaklyn op.
-
wanneer die punt regs van die optimale punt is, gaan sy raaklyn af.
Die rigting van 'n lyn word bepaal deur die teken van sy helling:
-
'n Lyn gaan op die helling is positief.
-
'n Lyn gaan af die helling is negatief.
Let daarop dat: \
Die helling van die raaklyn van 'n funksie in 'n sekere punt is nie meer as die afgeleide in daardie punt nie:
So as 'n antwoord op die vraag "Waarheen moet ons skuif?":
-
regs van Ons moet na links skuif.
-
aan die linkerkant van Ons moet na regs skuif.
Die stappe
Nou vir die tweede vraag, Hoeveel moet ons skuif?
Kyk na die volgende voorbeelde:
Ons kan aflei dat:
-
is naby aan => Die helling van die raaklyn is klein => is klein.
-
is ver van => Die helling van die raaklyn is groot => is groot.
Deur beide vrae te beantwoord, het ons tot die gevolgtrekking gekom dat slegs die kennis van die afgeleide in die punt ons baie insig kan gee oor die rigting en die afstand van die optimale punt .
Gradiënt afkoms
Gradiënt afkoms is die formulering van die antwoorde van die vorige twee vrae. Dit is 'n iteratiewe optimeringsalgoritme wat die minimum van funksie benader vanaf 'n ewekansige beginpunt . Die algoritme word soos volg gestel:
waar:
-
is nie meer as die afgeleide van in die punt nie.
-
is 'n positiewe konstante wat bepaal hoe groot die stappe gaan wees.
Let daarop dat:
-
is regs van => => => beweeg na links.
-
is aan die linkerkant van => => => skuif na regs.
-
naby aan => naby aan => Klein opdatering na .
Vasvra
-
Wanneer hou gradiënt afkoms op om te herhaal:
-
Wanneer klein genoeg is.
-
Wanneer naby aan is.
-
Wanneer . XXX
-
Hoe kies ons :
-
Ons kies dit lukraak. XXX
-
Ons neem dit in die omgewing van .
-
Dit hang af van die probleem.
-
Hoekom het ons gradiënt afkoms nodig:
-
Omdat rekenaars nie kragtig genoeg is om afgeleides te bereken nie.
-
Omdat dit uiters moeilik is om die afgeleide formules van diepleermodelle te vind. XXX
-
Omdat funksies meer as een plaaslike minimum het.