Nadzorovano učenje
Nadzorovano učenje vključuje usposabljanje modela na označenem naboru podatkov. Označeni podatki pomenijo, da so vhodni podatki združeni s pravilnim izhodom. Cilj je, da se model nauči preslikave ali razmerja med vhodi in izhodi, tako da lahko naredi napovedi ali natančno razvrsti nove, nevidene podatke. Obstajata dve glavni vrsti nadzorovanega učenja:
-
Klasifikacija: To vključuje predvidevanje kategorične oznake. Na primer, ugotavljanje, ali je e-poštno sporočilo vsiljena pošta ali ne, na podlagi določenih lastnosti (kot so uporabljene besede, pošiljatelj itd.). Za klasifikacijo se uporabljajo algoritmi, kot so podporni vektorski stroji (SVM), odločitvena drevesa in nevronske mreže.
-
Regresija: Vključuje napovedovanje zvezne vrednosti. Na primer, napovedovanje cene hiše na podlagi njenih značilnosti, kot so površina, število spalnic itd. Algoritmi, kot so linearna regresija, naključni gozd in gradientno povečanje, se uporabljajo za naloge regresije.
Učenje brez nadzora
Nenadzorovano učenje vključuje usposabljanje modela na neoznačenem naboru podatkov. Tu poskuša algoritem najti skrite vzorce ali intrinzične strukture v podatkih brez izrecnega nadzora. Cilj je raziskati podatke, razumeti njihovo strukturo in pridobiti pomembne vpoglede. Pogoste vrste nenadzorovanega učenja vključujejo:
-
Gručenje: Združevanje podobnih podatkovnih točk skupaj na podlagi določenih lastnosti ali podobnosti. Na primer, združevanje segmentov strank v skupine glede na njihovo nakupovalno vedenje z uporabo algoritmov, kot sta K-Means ali Hierarchical Clustering.
-
Zmanjšanje dimenzij: Zmanjšanje števila funkcij ob ohranjanju bistvenih informacij. Analiza glavnih komponent (PCA) in t-razdeljena stohastična vdelava sosedov (t-SNE) se uporabljata za vizualizacijo visokodimenzionalnih podatkov v nižjedimenzionalnem prostoru.
Kdaj uporabiti vsakega
-
Nadzorovano učenje se uporablja, ko imate označene podatke in želite predvideti ali razvrstiti prihodnje primere na podlagi teh označenih podatkov. Na primer, če imate zgodovinske podatke o nakupih strank in želite predvideti prihodnje nakupe, je primerno učenje pod nadzorom.
-
Učenje brez nadzora se uporablja, ko nimate označenih podatkov ali ko želite raziskati in razumeti osnovno strukturo podatkov. Na primer pri odkrivanju nepravilnosti ali iskanju skritih vzorcev v velikih naborih podatkov.
Včasih se lahko uporabi kombinacija obeh vrst učenja, znana kot polnadzorovano učenje, ko imate majhno količino označenih podatkov in veliko količino neoznačenih podatkov, kar omogoča modelom, da izkoristijo oba vira informacij. .