Förstå övervakat och oövervakat lärande
Uppdaterad på June 22, 2024 2 minuter läst

Övervakat lärande
Övervakat lärande innebär att man tränar en modell på en märkt dataset. Märkt data betyder att indata är parat med rätt utdata. Målet är att modellen ska lära sig kartläggningen eller förhållandet mellan indata och utdata så att den kan göra förutsägelser eller klassificera nya, osynliga data korrekt. Det finns två huvudtyper av övervakat lärande:
-
Klassificering: Detta innebär att förutsäga en kategorisk etikett. Till exempel att avgöra om ett e-postmeddelande är skräppost eller inte, baserat på vissa funktioner (som använda ord, avsändare, etc.). Algoritmer som Support Vector Machines (SVM), Decision Trees och Neural Networks används för klassificering.
-
Regression: Innebär att förutsäga ett kontinuerligt värde. Till exempel att förutsäga priset på ett hus baserat på dess egenskaper som yta, antal sovrum, etc. Algoritmer som linjär regression, slumpmässig skog och gradientförstärkning används för regressionsuppgifter.
Oövervakat lärande
Oövervakat lärande innebär att man tränar en modell på en omärkt datauppsättning. Här försöker algoritmen hitta dolda mönster eller inneboende strukturer i datan utan någon explicit övervakning. Syftet är att utforska data, förstå dess struktur och extrahera meningsfulla insikter. Vanliga typer av oövervakat lärande inkluderar:
-
Klustring: Gruppering av liknande datapunkter baserat på vissa egenskaper eller likheter. Till exempel klustera kundsegment baserat på deras köpbeteende med hjälp av algoritmer som K-Means eller Hierarchical Clustering.
-
Reducering av dimensioner: Minska antalet funktioner samtidigt som viktig information behålls. Principal Component Analysis (PCA) och t-Distribuerad Stokastisk Neighbor Embedding (t-SNE) används för att visualisera högdimensionell data i ett lägre dimensionellt utrymme.
När du ska använda varje
-
Supervised Learning används när du har märkt data och vill förutsäga eller klassificera framtida instanser baserat på den märkta datan. Om du till exempel har historiska data om kundköp och vill förutsäga framtida köp, är övervakat lärande lämpligt.
-
Unsupervised Learning används när du inte har märkt data eller när du vill utforska och förstå den underliggande strukturen i datan. Till exempel vid avvikelsedetektering eller att hitta dolda mönster i stora datamängder.
Ibland kan en kombination av båda typerna av lärande, känd som semi-övervakat lärande, användas när du har en liten mängd märkt data och en stor mängd omärkt data, vilket gör att modeller kan dra nytta av båda informationskällorna .