Reguliavimo metodai, tokie kaip L1 ir L2, naudojami siekiant išvengti per didelio pritaikymo mašininio mokymosi modeliuose, skiriant bausmes už didelius koeficientus.
L1 reguliavimas, dar žinomas kaip Lasso reguliavimas, prideda baudos terminą, proporcingą absoliučiai požymių koeficientų vertei. Jis skatina retumą sumažindamas kai kuriuos koeficientus iki tiksliai nulio, efektyviai atrinkdamas funkcijas, pašalindamas mažiau svarbias savybes. Dėl šios funkcijos pasirinkimo galimybės L1 reguliavimas ypač naudingas dirbant su duomenų rinkiniais su daugybe funkcijų, nes padeda supaprastinti modelius sutelkiant dėmesį į svarbiausias funkcijas. Gautas modelio supaprastinimas sumažina permontavimą.
Kita vertus, L2 reguliavimas, dar žinomas kaip Ridge reguliavimas, prideda baudos terminą, proporcingą požymių koeficientų kvadratui. Tai nepriverčia koeficientų tapti tiksliai nuliu, o sumažina juos iki nulio, todėl visos funkcijos tam tikru mastu prisideda prie modelio. L2 reguliavimas yra veiksmingas sprendžiant daugiakolineariškumą ir paprastai sukuria stabilesnius, bet mažiau retus modelius, palyginti su L1 reguliavimu.
Scenarijai, kai L1 reguliavimas gali būti naudingesnis, yra šie:
– Didelių matmenų duomenų rinkiniai su daugybe funkcijų: kai kalbama apie duomenų rinkinius, kuriuose funkcijų erdvė yra didelė, L1 sureguliavimas padeda automatiškai pasirinkti funkcijas, pagerina modelio aiškinamumą ir našumą.
- Kai tikimasi funkcijų negausumo: srityse, kuriose tikimasi, kad tik kelios funkcijos tikrai turi įtakos, L1 reguliavimas gali veiksmingai nustatyti šias funkcijas ir sutelkti dėmesį į jas.
Tačiau L1 reguliavimas gali būti ne toks veiksmingas scenarijuose, kai:
– Laikoma, kad visos funkcijos yra svarbios: jei manoma, kad dauguma funkcijų yra svarbios, o jų neįtraukimas gali sukelti informacijos praradimą, L1 gali būti ne geriausias pasirinkimas, nes koeficientai paprastai nustatomi į nulį.
- Duomenų rinkinyje yra daugiakolineariškumo problemų: L2 reguliavimas geriau tinka daugiakolineariškumo problemoms spręsti, palyginti su L1 reguliavimu.
Praktikoje L1 ir L2 reguliavimų derinys, žinomas kaip Elastingas grynojo įteisinimas, gali būti naudojamas siekiant gauti naudos iš abiejų metodų, išnaudojant L1 retumą ir L2 stabilumą.