Giriş
Təsəvvür edin ki, bizim funksiyamız var və biz onun minimumunu tapmaq istəyirik. Nə edərdiniz?
Sadə deyilmi? Yalnız aşağıdakı tənliyi həll etməliyik:
Məsələ burasındadır ki, düsturunu tapmaq həmişə asan olmur, çünki onlar xüsusilə mürəkkəb funksiyalarla məşğul olduğumuz dərin öyrənmədə olduqca mürəkkəb olur. Beləliklə, törəməsinin düsturunu tapmağa ehtiyac olmadan bizə funksiyanın minimumunu təmin edə biləcək başqa bir üsul tapmalıyıq.
Gəlin bir az intuisiya quraq
Fərz edək ki, müvafiq qrafiki olan f funksiyamız var:
təsadüfi nöqtəsi ilə başlayaq. Məqsəd bu nöqtəni hərəkət etdirmək və onu -a elə yaxınlaşdırmaqdır ki, x* olsun. Beləliklə, problemi iki hissəyə bölmək olar:
-
nöqtəsini hansı istiqamətdə hərəkət etdirməliyik? Sol yoxsa Sağ?
-
Nə qədər köçürməliyik?
İstiqamət
Birinci suala cavab vermək üçün bir az intuisiya quraq. Aşağıdakı məqama nəzər salın:
Qeyd edək ki:
-
nöqtəsi optimal nöqtəsinin sağında olduqda onun tangens xətti yuxarı qalxır.
-
nöqtəsi optimal nöqtəsinin sağında olduqda onun tangens xətti aşağı enir.
Xəttin istiqaməti onun yamacının işarəsi ilə müəyyən edilir:
-
Xətt yuxarı qalxır \implies$$ yamacı a$ müsbət olur.
-
Xətt aşağı enir \a$ yamacının mənfi olduğunu bildirir.
Qeyd edək ki: \
Müəyyən nöqtəsində funksiyanın tangens xəttinin mailliyi həmin nöqtəsindəki törəmədən çox deyil:
Beləliklə, "-ı hara köçürməliyik?" sualına cavab olaraq:
-
-ın sağında Biz -nı sola köçürməliyik.
-
-ın solunda Biz -nı sağa köçürməliyik.
Addımlar
İndi ikinci suala, -ı nə qədər köçürməliyik?
Aşağıdakı nümunələrə nəzər salın:
Belə nəticəyə gələ bilərik:
-
-a yaxındır => Tangensin mailliyi kiçikdir => kiçikdir.
-
-dan uzaqdır => Tangensin mailliyi böyükdür => böyükdür.
Hər iki suala cavab verərək belə nəticəyə gəldik ki, yalnız nöqtəsindəki törəmə haqqında bilik bizə optimal nöqtəsinin istiqaməti və məsafəsi haqqında çoxlu fikir verə bilər.
Qradient eniş
Qradient eniş əvvəlki iki sualın cavablarının tərtibidir. Bu, təsadüfi başlanğıc nöqtəsindən başlayaraq funksiyanın minimum dəyərini təxmin edən optimallaşdırma iterativ alqoritmidir. Alqoritm aşağıdakı kimi ifadə edilir:
harada:
-
nöqtəsində -ın törəməsindən çox deyil.
-
addımların nə qədər böyük olacağını müəyyən edən müsbət sabitdir.
Qeyd edək ki:
-
-ın sağındadır => => => sola doğru hərəkət edir.
-
-ın solundadır => => => sağa doğru hərəkət edir.
-
yaxın => -a yaxın => .
Viktorina
-
Qradiyentin enməsi təkrarlanmağı nə vaxt dayandırır:
-
kifayət qədər kiçik olduqda.
-
-a yaxın olduqda.
-
olduqda. XXX
-
Necə seçirik:
-
Biz təsadüfi seçirik. XXX
-
Biz bunu məhəlləsində götürürük.
-
Problemdən asılıdır.
-
Nə üçün bizə gradient eniş lazımdır:
-
Çünki kompüterlər törəmələri hesablamaq üçün kifayət qədər güclü deyil.
-
Çünki dərin öyrənmə modellərinin törəmə düsturlarını tapmaq olduqca çətindir. XXX
-
Çünki funksiyaların birdən çox lokal minimumu var.
Master Data Science and AI ilə Code Labs Academy! Onlayn təlim düşərgəmizə qoşulun – Çevik Part-Time və Tam Zamanlı Seçimlər Mövcuddur.