կողմնակալության շեղումների փոխզիջումը հիմնարար հասկացություն է, որն օգնում է մեզ հասկանալ մոդելի ընդհանրացման սխալը:
կողմնակալություն-վարիանսային տարրալուծում
Կողմնակալությունը վերաբերում է սխալին, որը ներկայացվել է պարզեցված մոդելով իրական խնդրի մոտավորմամբ: Այն ներկայացնում է տարբերությունը մեր մոդելի միջին կանխատեսման****և ճիշտ արժեքի միջև, որը մենք փորձում ենք կանխատեսել: Բարձր կողմնակալությունը հաճախ հանգեցնում է թերապայմանավորման-չափազանց պարզեցված մոդելների, որոնք չեն կարողանում նկարագրել տվյալների բարդությունը:
Վարիանսը, մյուս կողմից, չափում է մոդելի զգայունությունը տվյալների հավաքածուի տատանումների նկատմամբ: Այն քանակականացնում է որքանով կտարբերվեն մոդելի կանխատեսումները, եթե այն վերապատրաստվեր տարբեր տվյալների հավաքածուների վրա: Բարձր շեղումը կարող է հանգեցնել գերհամապատասխանության- մոդելների, որոնք լավ են աշխատում մարզման տվյալների վրա, բայց վատ են ընդհանրացնում նոր, չտեսնված տվյալներին:
Փոխանակում և հարաբերություններ մոդելի բարդության հետ
Կողմնակալության և շեղումների միջև փոխզիջումը կարևոր է: Քանի որ մոդելի բարդությունը մեծանում է, կողմնակալությունը սովորաբար նվազում է (մոդելը կարող է ավելի բարդ օրինաչափություններ ֆիքսել), բայց շեղումը հակված է մեծանալու (մոդելը դառնում է ավելի զգայուն աղմուկի և ուսուցման տվյալների առանձնահատկությունների նկատմամբ): Այս երկու բաղադրիչների հավասարակշռումը առանցքային է մոդելի օպտիմալ աշխատանքին հասնելու համար:
Սխալի ներդրում և հաշվարկ
Ակնկալվող կանխատեսման սխալը կարելի է բաժանել երեք մասի.
-
Անկրճատելի սխալ (աղմուկ)
-
կողմնակալության քառակուսի
-
Տարբերություն
Մաթեմատիկորեն.
Սպասվող սխալ = Անկրճատելի սխալ + կողմնակալություն2+ Տարբերություն
Անմիջապես կողմնակալության և շեղումների հաշվարկը կարող է բարդ լինել, հատկապես իրական աշխարհի տվյալների համար: Տեխնիկաները, ինչպիսիք են խաչաձև վավերացումը, ուսուցման կորերը կամ օգտագործումը տվյալների բազայի տարբեր ենթաբազմությունների վերապատրաստման և վավերացման համար կարող են օգնել գնահատել այս բաղադրիչները:
Ռազմավարություններ՝ ուղղված բարձր կողմնակալությանը կամ բարձր շեղմանը
-
Բարձր կողմնակալություն.
-
Բարձր շեղում. բարձր շեղումներ լուծելու համար այնպիսի մեթոդներ, ինչպիսիք են կարգավորումը (օրինակ` Lasso, Ridge), մոդելի բարդության նվազեցում (հատկանիշի ընտրություն, չափերի կրճատում) կամ ավելի շատ տվյալներ հավաքելը կարող է օգտակար լինել:
Բարելավում վերլուծության միջոցով
Վերլուծելով կողմնակալության-տարբերման փոխզիջումը՝ մենք կարող ենք պատկերացում կազմել մոդելի վարքագծի վերաբերյալ: Մենք կարող ենք ընտրել խնդրի բարդության համապատասխան մակարդակ, հասկանալ՝ մոդելը թերհամապատասխանո՞ւմ է, թե՞ գերազանցում է, և կիրառել համապատասխան ռազմավարություններ՝ արդյունավետությունը բարելավելու համար:
Օրինակ, եթե մոդելը ցույց է տալիս մեծ շեղում, մենք կարող ենք դիտարկել այն պարզեցնելու հնարավորությունները՝ նվազեցնելով գործառույթների քանակը կամ օգտագործելով կանոնավորացման տեխնիկա: Ընդհակառակը, եթե այն ցույց է տալիս բարձր կողմնակալություն, ավելի բարդ մոդելի օգտագործումը կամ ավելի համապատասխան հատկանիշներ ավելացնելը կարող է օգնել:
Ի վերջո, նպատակն է հավասարակշռություն հաստատել կողմնակալության և շեղումների միջև՝ կառուցելու մոդելներ, որոնք լավ ընդհանրացնում են չտեսնված տվյալներին: