Učení pod dohledem
Učení pod dohledem zahrnuje trénování modelu na označené datové sadě. Označená data znamenají, že vstupní data jsou spárována se správným výstupem. Cílem je, aby se model naučil mapování nebo vztah mezi vstupy a výstupy, aby mohl předpovídat nebo přesně klasifikovat nová, neviditelná data. Existují dva hlavní typy výuky pod dohledem:
-
Klasifikace: To zahrnuje předvídání štítku kategorie. Například určení, zda je e-mail spam či nikoli, na základě určitých funkcí (jako jsou použitá slova, odesílatel atd.). Pro klasifikaci se používají algoritmy jako Support Vector Machines (SVM), rozhodovací stromy a neuronové sítě.
-
Regrese: Zahrnuje předpovídání souvislé hodnoty. Například předpovídání ceny domu na základě jeho vlastností, jako je plocha, počet ložnic atd. Algoritmy jako lineární regrese, náhodný les a zesílení gradientu se používají pro regresní úlohy.
Učení bez dozoru
Učení bez dozoru zahrnuje trénování modelu na neoznačené datové sadě. Zde se algoritmus snaží najít skryté vzory nebo vnitřní struktury v datech bez jakéhokoli explicitního dohledu. Cílem je prozkoumat data, pochopit jejich strukturu a získat smysluplné poznatky. Mezi běžné typy učení bez dozoru patří:
-
Shlukování: Seskupování podobných datových bodů na základě určitých vlastností nebo podobností. Například shlukování zákaznických segmentů na základě jejich nákupního chování pomocí algoritmů jako K-Means nebo Hierarchical Clustering.
-
Snížení rozměrů: Snížení počtu funkcí při zachování základních informací. Principal Component Analysis (PCA) a t-Distributed Stochastic Neighbor Embedding (t-SNE) se používají k vizualizaci vysokorozměrných dat v nízkorozměrném prostoru.
Kdy použít každý
-
Supervised Learning se používá, když máte označená data a chcete předvídat nebo klasifikovat budoucí instance na základě těchto označených dat. Pokud máte například historická data o nákupech zákazníků a chcete předvídat budoucí nákupy, je vhodné učení pod dohledem.
-
Učení bez dozoru se používá, když nemáte označená data nebo když chcete prozkoumat a porozumět základní struktuře dat. Například při detekci anomálií nebo hledání skrytých vzorců ve velkých souborech dat.
Někdy lze použít kombinaci obou typů učení, známou jako učení s částečným dohledem, když máte malé množství označených dat a velké množství neoznačených dat, což umožňuje modelům těžit z obou zdrojů informací. .