Ievads
Iedomājieties, ka mums ir funkcija un mēs vēlētos atrast tās minimumu. ko tu darītu?
Vienkārši vai ne? Mums ir jāatrisina tikai šāds vienādojums:
Lieta tāda, ka formulas atrašana ne vienmēr ir vienkārša, jo tās mēdz būt ārkārtīgi sarežģītas, it īpaši dziļās mācībās, kur mēs nodarbojamies ar sarežģītām funkcijām. Tāpēc mums ir jāatrod cita metode, kas var nodrošināt mums minimālo funkciju bez nepieciešamības atrast atvasinājuma formulu.
Veidosim kādu intuīciju
Pieņemsim, ka mums ir funkcija f ar atbilstošo grafiku:
Sāksim ar nejaušu punktu . Mērķis ir pārvietot šo punktu un padarīt to tuvāk un tuvāk tā, lai x*. Tātad problēmu var iedalīt divās daļās:
-
Kurā virzienā jāpārvieto punkts ? Pa kreisi vai pa labi?
-
Cik mums to vajadzētu pārvietot?
Virziens
Veidosim intuīciju, lai atbildētu uz pirmo jautājumu. Apskatiet šādu punktu:
Ņemiet vērā, ka:
-
ja punkts atrodas pa labi no optimālā punkta , tā pieskares līnija iet uz augšu.
-
ja punkts atrodas pa labi no optimālā punkta , tā pieskares līnija iet uz leju.
Līnijas virzienu nosaka tās slīpuma zīme:
-
Līnija iet uz augšu , slīpums ir pozitīvs.
-
Līnija iet uz leju , slīpums ir negatīvs.
Ņemiet vērā, ka: \
Funkcijas pieskares līnijas slīpums noteiktā punktā nav lielāks par atvasinājumu šajā punktā :
Tātad kā atbilde uz jautājumu "Kur mums vajadzētu pārvietot ?":
-
pa labi no Mums ir jāpārvieto pa kreisi.
-
pa kreisi no Mums ir jāpārvieto pa labi.
Soļi
Tagad par otro jautājumu Cik daudz mums vajadzētu pārvietot ?
Apskatiet tālāk norādītos piemērus.
Mēs varam secināt, ka:
-
ir tuvu => Pieskares slīpums ir mazs => ir mazs.
-
ir tālu no => Pieskares slīpums ir liels => ir liels.
Atbildot uz abiem jautājumiem, mēs secinājām, ka tikai zināšanas par atvasinājumu punktā var sniegt mums lielu ieskatu par optimālā punkta virzienu un attālumu.
Gradienta nolaišanās
Gradienta nolaišanās ir iepriekšējo divu jautājumu atbilžu formulējums. Tas ir optimizācijas iteratīvs algoritms, kas tuvina funkcijas minimālo vērtību , sākot no nejauša sākuma punkta . Algoritms ir norādīts šādi:
kur:
-
ir ne vairāk kā atvasinājums punktā .
-
ir pozitīva konstante, kas nosaka, cik lieli būs soļi.
Ņemiet vērā, ka:
-
atrodas pa labi no => => => pārvietojas pa kreisi.
-
atrodas pa kreisi no => => => pārvietojas pa labi.
-
tuvu => tuvu => neliels atjauninājums .
Viktorīna
-
Kad gradienta nolaišanās pārtrauc atkārtošanos:
-
Kad ir pietiekami mazs.
-
Ja ir tuvu .
-
Kad . XXX
- Kā mēs izvēlamies :
-
Mēs to izvēlamies nejauši. XXX
-
Mēs to uzņemam apkaimē.
-
Tas ir atkarīgs no problēmas.
-
Kāpēc mums ir nepieciešama gradienta nolaišanās:
-
Tāpēc, ka datori nav pietiekami jaudīgi, lai aprēķinātu atvasinājumus.
-
Jo ir ārkārtīgi grūti atrast dziļās mācīšanās modeļu atvasinājumu formulas. XXX
-
Tā kā funkcijām ir vairāk nekā viens lokālais minimums.
* Apgūstiet Datu zinātni un mākslīgo intelektu ar Code Labs Academy! Pievienojieties mūsu tiešsaistes bootcamp — ir pieejamas elastīgas nepilna un pilnas slodzes iespējas.*