L1-ի և L2-ի կանոնավորացման դերը գերազանցելու և մոդելի ընդհանրացման բարելավման գործում

Թարմացվել է September 27, 2024 2 Րոպեներ կարդացեք

Կարգավորումը վերաբերում է մի շարք տեխնիկայի, որոնք օգտագործվում են չափից դուրս տեղակայումը կանխելու և բարելավելու մոդելի ընդհանրացումը: Գերհարմարեցումը տեղի է ունենում, երբ մոդելը շատ լավ է սովորում ուսուցման տվյալները՝ ձայնագրելով աղմուկը և կոնկրետ մանրամասները, որոնք չեն վերաբերում նոր, չտեսնված տվյալներին: Կանոնավորումն օգնում է վերահսկել դա՝ մոդելի օբյեկտիվ ֆունկցիային ավելացնելով տույժ ժամկետ՝ չխրախուսելով չափազանց բարդ մոդելները:

Կանոնավորեցման երկու ընդհանուր տեսակներ են՝ L1 և L2 կանոնավորացումը.

L1 կանոնավորացում (Լասսոյի հետընթաց).

L1 կանոնավորացումը ծախսերի ֆունկցիային ավելացնում է տուգանքի ժամկետ, որը հավասար է մոդելի գործակիցների բացարձակ արժեքներին:
Այն խրախուսում է սակավությունը մոդելում` որոշ գործակիցներ փոքրացնելով մինչև ուղիղ զրոյի, արդյունավետորեն կատարելով առանձնահատկությունների ընտրություն:
Ստացված մոդելն ավելի պարզ է և հեշտ մեկնաբանելի, քանի որ այն ընտրում է միայն ամենակարևոր առանձնահատկությունները՝ հրաժարվելով քիչ համապատասխաններից:

L2 կանոնավորացում (Rridge Regression):

L2 կանոնավորացումը ծախսերի ֆունկցիային ավելացնում է տուգանքի ժամկետ, որը հավասար է մոդելի գործակիցների քառակուսի մեծություններին:
Այն հակված է նվազեցնելու պակաս կարևոր հատկանիշների գործակիցները դեպի զրոյի, բայց հազվադեպ է դրանք սահմանում ճշգրիտ զրոյի:
L2 կանոնավորացումն արդյունավետ է չափից դուրս տեղադրումը կանխելու համար՝ պատժելով մեծ կշիռները և, հետևաբար, նվազեցնելով մոդելի բարդությունը:

Ե՛վ L1, և՛ L2 կանոնավորացման տեխնիկան օգնում է նվազեցնել չափից ավելի հարմարեցումը և բարելավել մոդելի կարողությունը ընդհանրացնելու անտեսանելի տվյալներին: L1 և L2 կանոնավորացման միջև ընտրությունը հաճախ կախված է կոնկրետ խնդրից, առանձնահատկությունների բնույթից և ցանկալի արդյունքից: Lasso (L1) կանոնավորացումը, իր առանձնահատկությունների ընտրության հատկությամբ, նախընտրելի է, երբ անհրաժեշտություն կա բացահայտելու առավել համապատասխան հատկանիշները: Ridge (L2) կանոնավորացումը հարմար է, երբ բոլոր հատկանիշները պոտենցիալ կարևոր են և նախընտրելի է նվազեցնել դրանց ազդեցությունը՝ առանց դրանք ամբողջությամբ վերացնելու: Բացի այդ, երկու տեխնիկայի համակցությունը, որը հայտնի է որպես Էլաստիկ ցանցի կանոնավորացում, կարող է օգտագործվել միաժամանակ և՛ L1, և՛ L2 կանոնավորացումից օգտվելու համար: