Qradient eniş

dərin öyrənmə
riyaziyyat
gradient eniş
Qradient eniş cover image

Giriş

Təsəvvür edin ki, bizim f(x)f(x) funksiyamız var və biz onun minimumunu tapmaq istəyirik. Nə edərdiniz?

Sadə deyilmi? Yalnız aşağıdakı tənliyi həll etməliyik:

f(x)=0f'(x) = 0

Məsələ burasındadır ki, ff' düsturunu tapmaq həmişə asan olmur, çünki onlar xüsusilə mürəkkəb funksiyalarla məşğul olduğumuz dərin öyrənmədə olduqca mürəkkəb olur. Beləliklə, ff' törəməsinin düsturunu tapmağa ehtiyac olmadan bizə funksiyanın minimumunu təmin edə biləcək başqa bir üsul tapmalıyıq.

Gəlin bir az intuisiya quraq

Fərz edək ki, müvafiq qrafiki olan f funksiyamız var:

Graph 1

x0x_{0} təsadüfi nöqtəsi ilə başlayaq. Məqsəd bu nöqtəni hərəkət etdirmək və onu xx*-a elə yaxınlaşdırmaqdır ki, f(f'(x*)=0) = 0 olsun. Beləliklə, problemi iki hissəyə bölmək olar:

  • xx nöqtəsini hansı istiqamətdə hərəkət etdirməliyik? Sol yoxsa Sağ?

  • Nə qədər köçürməliyik?

İstiqamət

Birinci suala cavab vermək üçün bir az intuisiya quraq. Aşağıdakı məqama nəzər salın:

Graph 2

Graph 3

Qeyd edək ki:

  • x0x_{0} nöqtəsi optimal xx* nöqtəsinin sağında olduqda onun tangens xətti yuxarı qalxır.

  • x0x_{0} nöqtəsi optimal xx* nöqtəsinin sağında olduqda onun tangens xətti aşağı enir.

Xəttin istiqaməti onun yamacının işarəsi ilə müəyyən edilir:

  • Xətt yuxarı qalxır \implies$$ yamacı a$ müsbət olur.

  • Xətt aşağı enir \a$ yamacının mənfi olduğunu bildirir.

Qeyd edək ki: \

Müəyyən x0x_{0} nöqtəsində funksiyanın tangens xəttinin mailliyi həmin f(x0)f'(x_{0}) nöqtəsindəki törəmədən çox deyil:

tangent(x0):g(x)=f(x0).(xx0)+f(x0)tangent(x*{0}): g(x) = f'(x*{0}).(x-x*{0}) + f(x*{0})

Beləliklə, "x0x_{0}-ı hara köçürməliyik?" sualına cavab olaraq:

  • f(x0)<0f'(x_{0}) < 0     \implies x0x_{0} xx*-ın sağında     \implies Biz x0x_{0}-nı sola köçürməliyik.

  • f(x0)>0f'(x_{0}) > 0     \implies x0x_{0} xx*-ın solunda     \implies Biz x0x_{0}-nı sağa köçürməliyik.

Addımlar

İndi ikinci suala, x0x_{0}-ı nə qədər köçürməliyik?

Aşağıdakı nümunələrə nəzər salın:

Graph 4

Graph 5

Belə nəticəyə gələ bilərik:

  • x0x_{0} xx*-a yaxındır => Tangensin mailliyi kiçikdir => f(x0)f'(x_{0}) kiçikdir.

  • x0x_{0} xx*-dan uzaqdır => Tangensin mailliyi böyükdür => f(x0)f'(x_{0}) böyükdür.

Hər iki suala cavab verərək belə nəticəyə gəldik ki, yalnız x0x_{0} nöqtəsindəki törəmə haqqında bilik bizə optimal x0x_{0} nöqtəsinin istiqaməti və məsafəsi haqqında çoxlu fikir verə bilər.

Qradient eniş

Qradient eniş əvvəlki iki sualın cavablarının tərtibidir. Bu, x0x_{0} təsadüfi başlanğıc nöqtəsindən başlayaraq funksiyanın minimum xx* dəyərini təxmin edən optimallaşdırma iterativ alqoritmidir. Alqoritm aşağıdakı kimi ifadə edilir:

xn+1=xnlr×dfdx_nx*{n+1} = x*{n} - lr \times \frac{\mathrm{d} f}{\mathrm{d} x\_{n}}

harada:

  • dfdxn\frac{\mathrm{d} f}{\mathrm{d} x*{n}} xnx*{n} nöqtəsində ff-ın törəməsindən çox deyil.

  • lrlr addımların nə qədər böyük olacağını müəyyən edən müsbət sabitdir.

Qeyd edək ki:

  • xnx_{n} xx*-ın sağındadır => dfdxn>0\frac{\mathrm{d} f}{\mathrm{d} x_{n}} > 0 => xn+1=xnmu¨sbətx_{n+ 1} = x_{n} - müsbət => xnx_{n} sola doğru hərəkət edir.

  • xnx_{n} xx*-ın solundadır => dfdxn<0\frac{\mathrm{d} f}{\mathrm{d} x_{n}} < 0 => xn+1=xn+mu¨sbətx*{n +1} = x*{n} + müsbət => xnx_{n} sağa doğru hərəkət edir.

  • xnx_{n} yaxın xx* => dfdxn\frac{\mathrm{d} f}{\mathrm{d} x_{n}} 00-a yaxın => xakic\cikyeniləmənx_{-a kiçik yeniləmə n}.

Viktorina

  • Qradiyentin enməsi təkrarlanmağı nə vaxt dayandırır:

  • xnx_{n} kifayət qədər kiçik olduqda.

  • xnx_{n} x0x_{0}-a yaxın olduqda.

  • dfdx_n=0\frac{\mathrm{d} f}{\mathrm{d} x\_{n}} = 0 olduqda. XXX

  • Necə x0x_{0} seçirik:

  • Biz təsadüfi seçirik. XXX

  • Biz bunu xnx_{n} məhəlləsində götürürük.

  • Problemdən asılıdır.

  • Nə üçün bizə gradient eniş lazımdır:

  • Çünki kompüterlər törəmələri hesablamaq üçün kifayət qədər güclü deyil.

  • Çünki dərin öyrənmə modellərinin törəmə düsturlarını tapmaq olduqca çətindir. XXX

  • Çünki funksiyaların birdən çox lokal minimumu var.


Master Data Science and AI ilə Code Labs Academy! Onlayn təlim düşərgəmizə qoşulun – Çevik Part-Time və Tam Zamanlı Seçimlər Mövcuddur.


Career Services background pattern

Karyera Xidmətləri

Contact Section background image

Əlaqə saxlayaq

Code Labs Academy © 2025 Bütün hüquqlar qorunur.