L1 և L2 կանոնավորացում մեքենայական ուսուցման մեջ

Թարմացվել է September 27, 2024 2 Րոպեներ կարդացեք

Կանոնավորեցման մեթոդները, ինչպիսիք են L1-ը և L2-ը, օգտագործվում են մեքենայական ուսուցման մոդելներում ավելորդ հարմարեցումը կանխելու համար՝ պատժելով մեծ գործակիցները:

L1 կանոնավորացումը, որը նաև հայտնի է որպես Lasso կանոնավորացում, ավելացնում է տուգանքի ժամկետ, որը համաչափ է հատկանիշների գործակիցների բացարձակ արժեքին: Այն խրախուսում է սակավությունը՝ որոշ գործակիցներ հասցնելով ուղիղ զրոյի՝ արդյունավետ կերպով կատարելով առանձնահատկությունների ընտրությունը՝ վերացնելով պակաս կարևոր հատկանիշները: Հատկանիշների ընտրության այս հնարավորությունը L1-ի կանոնավորացումը հատկապես օգտակար է դարձնում մեծ թվով հատկանիշներով տվյալների հավաքածուների հետ գործ ունենալիս, քանի որ այն օգնում է պարզեցնել մոդելները՝ կենտրոնանալով առավել համապատասխան հատկանիշների վրա: Արդյունքում մոդելի պարզեցումը նվազեցնում է չափից ավելի հարմարեցումը:

Մյուս կողմից, L2 կանոնավորացումը, որը նաև հայտնի է որպես Ridge կանոնավորացում, ավելացնում է տույժի ժամկետ, որը համաչափ է հատկանիշների գործակիցների քառակուսին: Այն չի ստիպում գործակիցներին դառնալ ուղիղ զրոյական, փոխարենը կրճատում է դրանք դեպի զրոյի՝ ստիպելով բոլոր հատկանիշները որոշ չափով նպաստել մոդելին: L2 կանոնավորացումն արդյունավետ է բազմակողմանիությունը կարգավորելու համար և, ընդհանուր առմամբ, հանգեցնում է ավելի կայուն, բայց ավելի քիչ նոսր մոդելների՝ համեմատած L1 կանոնավորացման հետ:

Սցենարները, որտեղ L1 կանոնավորացումը կարող է ավելի շահավետ լինել, ներառում են.

Բարձրաչափ տվյալների հավաքածուներ բազմաթիվ առանձնահատկություններով. Երբ գործ ունենք տվյալների շտեմարանների հետ, որտեղ առանձնահատկությունների տարածությունը մեծ է, L1 կանոնավորացումը օգնում է գործառույթների ավտոմատ ընտրությանը` բարելավելով մոդելի մեկնաբանելիությունը և կատարողականությունը:
Երբ սպասվում է առանձնահատկությունների սակավություն. այն տիրույթներում, որտեղ ակնկալվում է, որ միայն մի քանի առանձնահատկություններ են իսկապես ազդեցիկ, L1 կանոնավորացումը կարող է արդյունավետ կերպով բացահայտել և կենտրոնանալ այդ հատկանիշների վրա:

Այնուամենայնիվ, L1 կանոնավորացումը կարող է ավելի քիչ արդյունավետ լինել այն սցենարներում, որտեղ.

Բոլոր հատկանիշները ենթադրվում են կարևոր. Եթե համոզմունք կա, որ գործառույթների մեծ մասը տեղին է, և դրանց բացառումը կարող է հանգեցնել տեղեկատվության կորստի, L1-ը կարող է լավագույն ընտրությունը չլինել, քանի որ այն հակված է գործակիցները սահմանել զրոյի:
Տվյալների հավաքածուն ունի բազմակողմանիության խնդիրներ. L2 կանոնավորացումը ավելի հարմար է բազմակողմանիության խնդիրների լուծման համար, համեմատած L1 կանոնավորացման:

Գործնականում, L1 և L2 կանոնավորացման համակցությունը, որը հայտնի է որպես Elastic Net կանոնավորացում, կարող է օգտագործվել երկու մեթոդներից օգտվելու համար՝ օգտագործելով L1-ի սակավությունը և L2-ի կայունությունը: