教師あり学習と教師なし学習を理解する

教師あり学習、教師なし学習、データ
教師あり学習と教師なし学習を理解する cover image

教師あり学習

教師あり学習には、ラベル付きデータセットでモデルをトレーニングすることが含まれます。ラベル付きデータは、入力データが正しい出力とペアになっていることを意味します。目標は、モデルが入力と出力の間のマッピングまたは関係を学習して、予測を行ったり、新しい未確認データを正確に分類したりできるようにすることです。教師あり学習には主に 2 つのタイプがあります。

  • 分類: これには、カテゴリラベルの予測が含まれます。たとえば、特定の特徴 (使用されている単語、送信者など) に基づいて、電子メールがスパムであるかどうかを判断します。サポート ベクター マシン (SVM)、デシジョン ツリー、ニューラル ネットワークなどのアルゴリズムが分類に使用されます。

  • 回帰: 連続値の予測が含まれます。たとえば、面積、寝室の数などの特徴に基づいて住宅の価格を予測します。回帰タスクには、線形回帰、ランダム フォレスト、勾配ブースティングなどのアルゴリズムが使用されます。

教師なし学習

教師なし学習には、ラベルのないデータセットでモデルをトレーニングすることが含まれます。ここで、アルゴリズムは、明示的な監視なしで、データ内の隠れたパターンまたは固有の構造を見つけようとします。目的は、データを調査し、その構造を理解し、有意義な洞察を抽出することです。一般的な教師なし学習の種類は次のとおりです。

  • クラスタリング: 特定の特徴または類似性に基づいて、同様のデータ ポイントをグループ化します。たとえば、K 平均法や階層クラスタリングなどのアルゴリズムを使用して、顧客の購買行動に基づいて顧客セグメントをクラスタリングします。

  • 次元削減: 重要な情報を保持しながら機能の数を削減します。主成分分析 (PCA) と t 分布確率的近傍埋め込み (t-SNE) は、高次元データを低次元空間で視覚化するために使用されます。

それぞれをいつ使用するか

  • 教師あり学習は、データにラベルを付け、そのラベル付きデータに基づいて将来のインスタンスを予測または分類する場合に使用します。たとえば、顧客の購入に関する履歴データがあり、将来の購入を予測したい場合は、教師あり学習が適しています。

  • 教師なし学習は、ラベル付きデータがない場合、またはデータの基礎となる構造を調査して理解したい場合に使用されます。たとえば、異常検出や大規模なデータセット内の隠れたパターンの発見などです。

場合によっては、半教師あり学習として知られる両方のタイプの学習の組み合わせを、少量のラベル付きデータと大量のラベルなしデータがある場合に採用して、モデルが両方の情報源から恩恵を受けることができるようにすることができます。 。


Career Services background pattern

キャリアサービス

Contact Section background image

連絡を取り合いましょう

Code Labs Academy © 2024 無断転載を禁じます.