Uzraudzīta mācīšanās
Uzraudzītā mācīšanās ietver modeļa apmācību marķētā datu kopā. Apzīmētie dati nozīmē, ka ievades dati ir savienoti pārī ar pareizo izvadi. Mērķis ir, lai modelis iemācītos kartēšanu vai attiecības starp ievadiem un izvadiem, lai tas varētu veikt prognozes vai precīzi klasificēt jaunus, neredzētus datus. Ir divi galvenie uzraudzītās apmācības veidi:
-
Klasifikācija: tas ietver kategoriskas etiķetes paredzēšanu. Piemēram, lai noteiktu, vai e-pasts ir surogātpasts, pamatojoties uz noteiktām funkcijām (piemēram, lietotajiem vārdiem, sūtītāju utt.). Klasifikācijai tiek izmantoti tādi algoritmi kā atbalsta vektora mašīnas (SVM), lēmumu koki un neironu tīkli.
-
Regresija: ietver nepārtrauktas vērtības prognozēšanu. Piemēram, mājas cenas prognozēšana, pamatojoties uz tās īpašībām, piemēram, platību, guļamistabu skaitu utt. Regresijas uzdevumiem tiek izmantoti tādi algoritmi kā Lineārā regresija, Random Forest un Gradient Boosting.
Mācības bez uzraudzības
Neuzraudzīta mācīšanās ietver modeļa apmācību neiezīmētā datu kopā. Šeit algoritms mēģina atrast slēptos modeļus vai raksturīgās struktūras datos bez īpašas uzraudzības. Mērķis ir izpētīt datus, izprast to struktūru un iegūt jēgpilnu ieskatu. Izplatītākie bez uzraudzības mācību veidi ir:
- Klasteru veidošana: līdzīgu datu punktu grupēšana kopā, pamatojoties uz noteiktām iezīmēm vai līdzībām. Piemēram, klientu segmentu grupēšana, pamatojoties uz viņu pirkšanas paradumiem, izmantojot tādus algoritmus kā K-Means vai hierarhiskā klasterizācija.
- Izmēru samazināšana: funkciju skaita samazināšana, vienlaikus saglabājot būtisku informāciju. Galveno komponentu analīze (PCA) un t-Distributed Stochastic Neighbor Embedding (t-SNE) tiek izmantota, lai vizualizētu augstas dimensijas datus zemākas dimensijas telpā.
Kad lietot katru
- Uzraudzītā mācīšanās tiek izmantota, ja jums ir iezīmēti dati un vēlaties paredzēt vai klasificēt turpmākos gadījumus, pamatojoties uz šiem iezīmētajiem datiem. Piemēram, ja jums ir vēsturiski dati par klientu pirkumiem un vēlaties paredzēt turpmākos pirkumus, piemērota ir uzraudzīta apmācība.
- Neuzraudzīta mācīšanās tiek izmantota, ja jums nav marķētu datu vai ja vēlaties izpētīt un izprast datu pamatā esošo struktūru. Piemēram, anomāliju noteikšanā vai slēptu modeļu atrašanā lielās datu kopās.
Dažreiz abu veidu mācīšanās kombināciju, kas pazīstama kā daļēji uzraudzīta mācīšanās, var izmantot, ja jums ir mazs marķētu datu apjoms un liels daudzums nemarķētu datu, ļaujot modeļiem gūt labumu no abiem informācijas avotiem. .