Valvotun ja ohjaamattoman oppimisen ymmärtäminen

Ohjattu oppiminen
valvomaton oppiminen
data
Valvotun ja ohjaamattoman oppimisen ymmärtäminen cover image

Ohjattu oppiminen

Valvottu oppiminen sisältää mallin koulutuksen merkitylle tietojoukolle. Merkitty data tarkoittaa, että syöttötiedot on yhdistetty oikean lähtöön. Tavoitteena on, että malli oppii kartoituksen tai syötteiden ja tulosten välisen suhteen, jotta se voi tehdä ennusteita tai luokitella uusia, näkymättömiä tietoja tarkasti. Ohjattua oppimista on kahta päätyyppiä:

  • Luokittelu: Tämä edellyttää kategorisen tunnisteen ennustamista. Esimerkiksi sen määrittäminen, onko sähköposti roskapostia vai ei, tiettyjen ominaisuuksien (kuten käytetyt sanat, lähettäjä jne.) perusteella. Luokitteluun käytetään algoritmeja, kuten tukivektorikoneita (SVM), päätöspuita ja hermoverkkoja.

  • Regressio: Sisältää jatkuvan arvon ennustamisen. Esimerkiksi talon hinnan ennustaminen sen ominaisuuksien, kuten pinta-alan, makuuhuoneiden jne. perusteella. Regressiotehtäviin käytetään algoritmeja, kuten Lineaarinen regressio, Random Forest ja Gradient Boosting.

Ohjaamaton oppiminen

Valvomaton oppiminen sisältää mallin koulutuksen merkitsemättömälle tietojoukolle. Tässä algoritmi yrittää löytää piilotettuja kuvioita tai sisäisiä rakenteita tiedoista ilman erityistä valvontaa. Tavoitteena on tutkia dataa, ymmärtää sen rakennetta ja saada merkityksellisiä oivalluksia. Yleisiä ohjaamattomia oppimistyyppejä ovat:

  • Klusterit: Samankaltaisten tietopisteiden ryhmittely yhteen tiettyjen ominaisuuksien tai yhtäläisyuksien perusteella. Esimerkiksi asiakassegmenttien klusterointi niiden ostokäyttäytymisen perusteella käyttämällä algoritmeja, kuten K-Means tai Hierarchical Clustering.

  • Ulottuvuuden vähentäminen: Ominaisuuksien määrän vähentäminen säilyttäen kuitenkin olennaiset tiedot. Pääkomponenttianalyysiä (PCA) ja t-Distributed Stochastic Neighbor Embeddingia (t-SNE) käytetään korkeaulotteisen datan visualisoimiseen alemman ulottuvuuden tilassa.

Milloin kutakin käyttää

  • Valvottua oppimista käytetään, kun sinulla on tunnistettua dataa ja haluat ennustaa tai luokitella tulevia ilmentymiä tämän merkittyjen tietojen perusteella. Jos sinulla on esimerkiksi historiatietoa asiakkaiden ostoista ja haluat ennakoida tulevia ostoksia, ohjattu oppiminen sopii.

  • Ohjaamatonta oppimista käytetään, kun sinulla ei ole merkittyjä tietoja tai kun haluat tutkia ja ymmärtää datan taustalla olevaa rakennetta. Esimerkiksi poikkeamien havaitsemisessa tai piilotettujen kuvioiden löytämisessä suurista tietojoukoista.

Joskus molempien oppimistyyppien yhdistelmää, joka tunnetaan nimellä puoliohjattu oppiminen, voidaan käyttää, kun sinulla on pieni määrä merkittyä tietoa ja suuri määrä merkitsemätöntä dataa, jolloin mallit voivat hyötyä molemmista tietolähteistä. .


Career Services background pattern

Urapalvelut

Contact Section background image

Pidetään yhteyttä

Code Labs Academy © 2024 Kaikki oikeudet pidätetään.