Uczenie nadzorowane
Uczenie nadzorowane obejmuje trenowanie modelu na oznaczonym zbiorze danych. Oznakowane dane oznaczają, że dane wejściowe są sparowane z prawidłowymi danymi wyjściowymi. Celem jest, aby model nauczył się mapowania lub relacji między danymi wejściowymi i wyjściowymi, aby mógł dokładnie przewidywać lub klasyfikować nowe, niewidoczne dane. Istnieją dwa główne typy uczenia nadzorowanego:
-
Klasyfikacja: Wiąże się to z przewidywaniem kategorycznej etykiety. Na przykład określenie, czy wiadomość e-mail jest spamem, czy nie, na podstawie pewnych cech (takich jak użyte słowa, nadawca itp.). Algorytmy takie jak maszyny wektorów nośnych (SVM), drzewa decyzyjne i sieci neuronowe są wykorzystywane do klasyfikacji.
-
Regresja: Obejmuje przewidywanie wartości ciągłej. Na przykład przewidywanie ceny domu na podstawie jego cech, takich jak powierzchnia, liczba sypialni itp. Algorytmy takie jak regresja liniowa, Random Forest i Gradient Boosting są używane do zadań regresji.
Uczenie się bez nadzoru
Uczenie bez nadzoru polega na trenowaniu modelu na nieoznakowanym zbiorze danych. W tym przypadku algorytm próbuje znaleźć ukryte wzorce lub wewnętrzne struktury w danych bez wyraźnego nadzoru. Celem jest zbadanie danych, zrozumienie ich struktury i wyciągnięcie znaczących wniosków. Typowe rodzaje uczenia bez nadzoru obejmują:
-
Grupowanie: Grupowanie podobnych punktów danych na podstawie określonych cech lub podobieństw. Na przykład grupowanie segmentów klientów na podstawie ich zachowań zakupowych przy użyciu algorytmów takich jak K-Means lub Hierarchical Clustering.
-
Redukcja wymiarowości: Zmniejszenie liczby cech przy jednoczesnym zachowaniu istotnych informacji. Principal Component Analysis (PCA) i t-Distributed Stochastic Neighbor Embedding (t-SNE) są używane do wizualizacji wielowymiarowych danych w przestrzeni o niższym wymiarze.
Kiedy używać każdego z nich
-
Uczenie nadzorowane jest używane, gdy masz oznaczone dane i chcesz przewidzieć lub sklasyfikować przyszłe instancje na podstawie tych oznaczonych danych. Na przykład, jeśli masz dane historyczne dotyczące zakupów klientów i chcesz przewidzieć przyszłe zakupy, odpowiednie jest uczenie nadzorowane.
-
Uczenie bez nadzoru jest stosowane, gdy nie masz oznaczonych danych lub gdy chcesz zbadać i zrozumieć podstawową strukturę danych. Na przykład w wykrywaniu anomalii lub znajdowaniu ukrytych wzorców w dużych zbiorach danych.
Czasami połączenie obu rodzajów uczenia się, znane jako uczenie pół-nadzorowane, może być stosowane, gdy masz niewielką ilość oznaczonych danych i dużą ilość nieoznaczonych danych, umożliwiając modelom korzystanie z obu źródeł informacji.