Понимание контролируемого и неконтролируемого обучения

Обучение с учителем
обучение без учителя
данные
Понимание контролируемого и неконтролируемого обучения cover image

Обучение под присмотром

Обучение с учителем предполагает обучение модели на маркированном наборе данных. Маркированные данные означают, что входные данные связаны с правильными выходными данными. Цель состоит в том, чтобы модель изучила сопоставление или взаимосвязь между входными и выходными данными, чтобы она могла делать прогнозы или точно классифицировать новые, невидимые данные. Существует два основных типа контролируемого обучения:

Классификация: предполагает прогнозирование категориальной метки. Например, определение того, является ли электронное письмо спамом или нет, на основе определенных характеристик (например, используемых слов, отправителя и т. д.). Для классификации используются такие алгоритмы, как машины опорных векторов (SVM), деревья решений и нейронные сети.

Регрессия: предполагает прогнозирование непрерывного значения. Например, прогнозирование цены дома на основе его характеристик, таких как площадь, количество спален и т. д. Для задач регрессии используются такие алгоритмы, как линейная регрессия, случайный лес и повышение градиента.

Обучение без присмотра

Обучение без учителя предполагает обучение модели на немаркированном наборе данных. Здесь алгоритм пытается найти скрытые закономерности или внутренние структуры в данных без какого-либо явного контроля. Цель состоит в том, чтобы изучить данные, понять их структуру и извлечь значимую информацию. К распространенным типам обучения без учителя относятся:

Кластеризация. Группировка схожих точек данных на основе определенных характеристик или сходств. Например, кластеризация сегментов клиентов на основе их покупательского поведения с использованием таких алгоритмов, как K-Means или иерархическая кластеризация.

  • Уменьшение размерности: сокращение количества функций при сохранении важной информации. Анализ главных компонентов (PCA) и t-распределенное стохастическое встраивание соседей (t-SNE) используются для визуализации многомерных данных в низкомерном пространстве.

Когда использовать каждый

  • Обучение с учителем используется, когда вы пометили данные и хотите спрогнозировать или классифицировать будущие экземпляры на основе этих помеченных данных. Например, если у вас есть исторические данные о покупках клиентов и вы хотите спрогнозировать будущие покупки, подойдет контролируемое обучение.

  • Обучение без учителя используется, когда у вас нет помеченных данных или когда вы хотите изучить и понять основную структуру данных. Например, при обнаружении аномалий или поиске скрытых закономерностей в больших наборах данных.

Иногда, когда у вас есть небольшой объем помеченных данных и большой объем немаркированных данных, можно использовать комбинацию обоих типов обучения, известную как полуконтролируемое обучение, что позволяет моделям извлечь выгоду из обоих источников информации. .


Career Services background pattern

Карьерные услуги

Contact Section background image

Давай останемся на связи

Code Labs Academy © 2024 Все права защищены.