Zrozumienie uczenia nadzorowanego i nienadzorowanego

Zaktualizowano: June 05, 2024 2 min czytania

Uczenie nadzorowane

Uczenie nadzorowane obejmuje trenowanie modelu na oznaczonym zbiorze danych. Oznakowane dane oznaczają, że dane wejściowe są sparowane z prawidłowymi danymi wyjściowymi. Celem jest, aby model nauczył się mapowania lub relacji między danymi wejściowymi i wyjściowymi, aby mógł dokładnie przewidywać lub klasyfikować nowe, niewidoczne dane. Istnieją dwa główne typy uczenia nadzorowanego:

Klasyfikacja: Wiąże się to z przewidywaniem kategorycznej etykiety. Na przykład określenie, czy wiadomość e-mail jest spamem, czy nie, na podstawie pewnych cech (takich jak użyte słowa, nadawca itp.). Algorytmy takie jak maszyny wektorów nośnych (SVM), drzewa decyzyjne i sieci neuronowe są wykorzystywane do klasyfikacji.
Regresja: Obejmuje przewidywanie wartości ciągłej. Na przykład przewidywanie ceny domu na podstawie jego cech, takich jak powierzchnia, liczba sypialni itp. Algorytmy takie jak regresja liniowa, Random Forest i Gradient Boosting są używane do zadań regresji.

Uczenie się bez nadzoru

Uczenie bez nadzoru polega na trenowaniu modelu na nieoznakowanym zbiorze danych. W tym przypadku algorytm próbuje znaleźć ukryte wzorce lub wewnętrzne struktury w danych bez wyraźnego nadzoru. Celem jest zbadanie danych, zrozumienie ich struktury i wyciągnięcie znaczących wniosków. Typowe rodzaje uczenia bez nadzoru obejmują:

Grupowanie: Grupowanie podobnych punktów danych na podstawie określonych cech lub podobieństw. Na przykład grupowanie segmentów klientów na podstawie ich zachowań zakupowych przy użyciu algorytmów takich jak K-Means lub Hierarchical Clustering.
Redukcja wymiarowości: Zmniejszenie liczby cech przy jednoczesnym zachowaniu istotnych informacji. Principal Component Analysis (PCA) i t-Distributed Stochastic Neighbor Embedding (t-SNE) są używane do wizualizacji wielowymiarowych danych w przestrzeni o niższym wymiarze.

Kiedy używać każdego z nich

Uczenie nadzorowane jest używane, gdy masz oznaczone dane i chcesz przewidzieć lub sklasyfikować przyszłe instancje na podstawie tych oznaczonych danych. Na przykład, jeśli masz dane historyczne dotyczące zakupów klientów i chcesz przewidzieć przyszłe zakupy, odpowiednie jest uczenie nadzorowane.
Uczenie bez nadzoru jest stosowane, gdy nie masz oznaczonych danych lub gdy chcesz zbadać i zrozumieć podstawową strukturę danych. Na przykład w wykrywaniu anomalii lub znajdowaniu ukrytych wzorców w dużych zbiorach danych.

Czasami połączenie obu rodzajów uczenia się, znane jako uczenie pół-nadzorowane, może być stosowane, gdy masz niewielką ilość oznaczonych danych i dużą ilość nieoznaczonych danych, umożliwiając modelom korzystanie z obu źródeł informacji.

Zdobądź umiejętności IT online z Code Labs Academy

Dołącz do naszej społeczności, odblokuj swój potencjał i rozpocznij satysfakcjonującą ścieżkę kariery w IT.

Finansowanie

Alumni

Centrum nauki

O nas

Społeczność

Dla firm