Обучение под присмотром
Обучение с учителем предполагает обучение модели на маркированном наборе данных. Маркированные данные означают, что входные данные связаны с правильными выходными данными. Цель состоит в том, чтобы модель изучила сопоставление или взаимосвязь между входными и выходными данными, чтобы она могла делать прогнозы или точно классифицировать новые, невидимые данные. Существует два основных типа контролируемого обучения:
– Классификация: предполагает прогнозирование категориальной метки. Например, определение того, является ли электронное письмо спамом или нет, на основе определенных характеристик (например, используемых слов, отправителя и т. д.). Для классификации используются такие алгоритмы, как машины опорных векторов (SVM), деревья решений и нейронные сети.
– Регрессия: предполагает прогнозирование непрерывного значения. Например, прогнозирование цены дома на основе его характеристик, таких как площадь, количество спален и т. д. Для задач регрессии используются такие алгоритмы, как линейная регрессия, случайный лес и повышение градиента.
Обучение без присмотра
Обучение без учителя предполагает обучение модели на немаркированном наборе данных. Здесь алгоритм пытается найти скрытые закономерности или внутренние структуры в данных без какого-либо явного контроля. Цель состоит в том, чтобы изучить данные, понять их структуру и извлечь значимую информацию. К распространенным типам обучения без учителя относятся:
– Кластеризация. Группировка схожих точек данных на основе определенных характеристик или сходств. Например, кластеризация сегментов клиентов на основе их покупательского поведения с использованием таких алгоритмов, как K-Means или иерархическая кластеризация.
- Уменьшение размерности: сокращение количества функций при сохранении важной информации. Анализ главных компонентов (PCA) и t-распределенное стохастическое встраивание соседей (t-SNE) используются для визуализации многомерных данных в низкомерном пространстве.
Когда использовать каждый
-
Обучение с учителем используется, когда вы пометили данные и хотите спрогнозировать или классифицировать будущие экземпляры на основе этих помеченных данных. Например, если у вас есть исторические данные о покупках клиентов и вы хотите спрогнозировать будущие покупки, подойдет контролируемое обучение.
-
Обучение без учителя используется, когда у вас нет помеченных данных или когда вы хотите изучить и понять основную структуру данных. Например, при обнаружении аномалий или поиске скрытых закономерностей в больших наборах данных.
Иногда, когда у вас есть небольшой объем помеченных данных и большой объем немаркированных данных, можно использовать комбинацию обоих типов обучения, известную как полуконтролируемое обучение, что позволяет моделям извлечь выгоду из обоих источников информации. .