Контрольоване навчання
Контрольоване навчання передбачає навчання моделі на позначеному наборі даних. Позначені дані означають, що вхідні дані поєднані з правильним виходом. Мета полягає в тому, щоб модель дізналася про відображення або зв’язок між входами та виходами, щоб вона могла робити прогнози або точно класифікувати нові, невидимі дані. Існує два основних типи навчання під наглядом:
-
Класифікація: передбачає передбачення категорійної мітки. Наприклад, визначення того, чи є електронний лист спамом, на основі певних ознак (наприклад, використані слова, відправник тощо). Для класифікації використовуються такі алгоритми, як опорні векторні машини (SVM), дерева рішень і нейронні мережі.
-
Регресія: передбачає прогнозування безперервного значення. Наприклад, прогнозування ціни будинку на основі його характеристик, таких як площа, кількість спалень тощо. Для завдань регресії використовуються такі алгоритми, як лінійна регресія, випадковий ліс і посилення градієнта.
Навчання без нагляду
Навчання без нагляду передбачає навчання моделі на наборі даних без міток. Тут алгоритм намагається знайти приховані шаблони або внутрішні структури в даних без будь-якого явного контролю. Мета полягає в тому, щоб вивчити дані, зрозуміти їх структуру та отримати значущі ідеї. Поширені типи неконтрольованого навчання включають:
-
Кластеризація: Групування подібних точок даних разом на основі певних особливостей або схожості. Наприклад, кластеризація сегментів клієнтів на основі їх купівельної поведінки за допомогою таких алгоритмів, як K-Means або ієрархічна кластеризація.
-
Зменшення розмірності: Зменшення кількості функцій зі збереженням важливої інформації. Аналіз основних компонентів (PCA) і t-розподілене стохастичне вбудовування сусідів (t-SNE) використовуються для візуалізації даних великої розмірності в просторі меншої розмірності.
Коли використовувати кожен
-
Контрольоване навчання використовується, коли ви позначили дані та хочете передбачити або класифікувати майбутні випадки на основі цих позначених даних. Наприклад, якщо у вас є історичні дані про покупки клієнтів і ви хочете передбачити майбутні покупки, навчання під наглядом підійде.
-
Неконтрольоване навчання використовується, коли у вас немає позначених даних або коли ви хочете вивчити та зрозуміти базову структуру даних. Наприклад, у виявленні аномалій або пошуку прихованих шаблонів у великих наборах даних.
Іноді можна застосувати поєднання обох типів навчання, відоме як напівконтрольоване навчання, коли у вас є невелика кількість позначених даних і велика кількість не позначених даних, що дозволяє моделям використовувати обидва джерела інформації. .