Кантраляванае навучанне
Навучанне пад кантролем прадугледжвае навучанне мадэлі на пазначаным наборы даных. Пазначаныя даныя азначаюць, што ўваходныя даныя спалучаюцца з правільным выхадам. Мэта складаецца ў тым, каб мадэль вывучыла адлюстраванне або ўзаемасувязь паміж уваходамі і выхадамі, каб яна магла рабіць прагнозы або дакладна класіфікаваць новыя нябачныя даныя. Ёсць два асноўных тыпу навучання пад наглядам:
-
Класіфікацыя: Гэта прадугледжвае прагназаванне катэгарыяльнай меткі. Напрыклад, вызначэнне таго, ці з'яўляецца паведамленне электроннай пошты спамам, на аснове пэўных прыкмет (напрыклад, выкарыстаных слоў, адпраўшчыка і г.д.). Для класіфікацыі выкарыстоўваюцца такія алгарытмы, як машыны падтрымкі вектараў (SVM), дрэвы прыняцця рашэнняў і нейронавыя сеткі.
-
Рэгрэсія: прадугледжвае прагназаванне бесперапыннага значэння. Напрыклад, прагназаванне цаны дома на падставе яго такіх характарыстык, як плошча, колькасць спальняў і г. д. Для задач рэгрэсіі выкарыстоўваюцца такія алгарытмы, як лінейная рэгрэсія, выпадковы лес і павышэнне градыенту.
Навучанне без кантролю
Навучанне без нагляду прадугледжвае навучанне мадэлі на непазначаным наборы даных. Тут алгарытм спрабуе знайсці схаваныя шаблоны або ўнутраныя структуры ў дадзеных без якога-небудзь відавочнага кантролю. Мэта складаецца ў тым, каб даследаваць даныя, зразумець іх структуру і атрымаць значную інфармацыю. Распаўсюджаныя тыпы некантраляванага навучання ўключаюць:
-
Кластэрызацыя: Групоўка падобных кропак даных на аснове пэўных прыкмет або падабенства. Напрыклад, кластэрызацыя сегментаў кліентаў на аснове іх пакупніцкіх паводзін з выкарыстаннем такіх алгарытмаў, як K-Means або іерархічная кластэрызацыя.
-
Памяншэнне памернасці: Памяншэнне колькасці функцый пры захаванні неабходнай інфармацыі. Аналіз галоўных кампанентаў (PCA) і t-размеркаванае стахастычнае ўбудаванне суседзяў (t-SNE) выкарыстоўваюцца для візуалізацыі даных высокай памернасці ў прасторы меншай памернасці.
Калі выкарыстоўваць кожны
-
Кантраляванае навучанне выкарыстоўваецца, калі ў вас ёсць пазначаныя даныя і вы хочаце прадбачыць або класіфікаваць будучыя выпадкі на аснове гэтых пазначаных даных. Напрыклад, калі ў вас ёсць гістарычныя дадзеныя аб пакупках кліентаў і вы хочаце прадбачыць будучыя пакупкі, падыдзе навучанне пад наглядам.
-
Некантраляванае навучанне выкарыстоўваецца, калі ў вас няма пазначаных даных або калі вы хочаце вывучыць і зразумець асноўную структуру даных. Напрыклад, пры выяўленні анамалій або пошуку схаваных шаблонаў у вялікіх наборах даных.
Часам можа выкарыстоўвацца спалучэнне абодвух тыпаў навучання, вядомае як напаўкантраляванае навучанне, калі ў вас ёсць невялікая колькасць пазначаных даных і вялікая колькасць не пазначаных даных, што дазваляе мадэлям карыстацца абедзвюма крыніцамі інфармацыі .