Leer onder toesig
Leer onder toesig behels die opleiding van 'n model op 'n benoemde datastel. Gemerkte data beteken dat die insetdata met die korrekte uitvoer gepaard is. Die doel is dat die model die kartering of verband tussen insette en uitsette leer sodat dit voorspellings kan maak of nuwe, onsigbare data akkuraat kan klassifiseer. Daar is twee hooftipes leer onder toesig:
-
Klassifikasie: Dit behels die voorspelling van 'n kategoriese etiket. Byvoorbeeld, om te bepaal of 'n e-pos strooipos is of nie strooipos op grond van sekere kenmerke (soos woorde wat gebruik word, sender, ens.). Algoritmes soos ondersteuningsvektormasjiene (SVM), besluitbome en neurale netwerke word vir klassifikasie gebruik.
-
Regressie: Behels die voorspelling van 'n kontinue waarde. Byvoorbeeld, die voorspelling van die prys van 'n huis op grond van sy kenmerke soos area, aantal slaapkamers, ens. Algoritmes soos Lineêre Regressie, Random Forest en Gradient Boosting word vir regressietake gebruik.
Leer sonder toesig
Leer sonder toesig behels die opleiding van 'n model op 'n onbenoemde datastel. Hier probeer die algoritme om verborge patrone of intrinsieke strukture in die data te vind sonder enige eksplisiete toesig. Die doel is om die data te verken, die struktuur daarvan te verstaan en betekenisvolle insigte te onttrek. Algemene tipes leer sonder toesig sluit in:
-
Klustering: Groepering van soortgelyke datapunte op grond van sekere kenmerke of ooreenkomste. Byvoorbeeld, groepering van klantesegmente op grond van hul aankoopgedrag deur algoritmes soos K-Means of Hiërargiese groepering te gebruik.
-
Dimensionaliteitvermindering: Verminder die aantal kenmerke terwyl noodsaaklike inligting behou word. Hoofkomponentanalise (PCA) en t-verspreide stogastiese buurinbedding (t-SNE) word gebruik om hoë-dimensionele data in 'n laer-dimensionele ruimte te visualiseer.
Wanneer om elkeen te gebruik
-
Leer onder toesig word gebruik wanneer jy data benoem het en toekomstige gevalle wil voorspel of klassifiseer op grond van daardie benoemde data. As jy byvoorbeeld historiese data oor klante-aankope het en toekomstige aankope wil voorspel, is leer onder toesig geskik.
-
Leer sonder toesig word gebruik wanneer jy nie gemerkte data het nie of wanneer jy die onderliggende struktuur van die data wil verken en verstaan. Byvoorbeeld, in afwykingsopsporing of om verborge patrone in groot datastelle te vind.
Soms kan 'n kombinasie van beide tipes leer, bekend as semi-toesig leer, gebruik word wanneer jy 'n klein hoeveelheid benoemde data en 'n groot hoeveelheid ongeëtiketteerde data het, wat modelle toelaat om voordeel te trek uit beide inligtingsbronne .