Խաչաձև վավերացումը կարևոր տեխնիկա է, որն օգտագործվում է գնահատելու որքան լավ մոդելը կգործի նոր տվյալների վրա: Առաջնային նպատակն է գնահատել մոդելի կատարումը այնպես, որ նվազագույնի հասցվի այնպիսի խնդիրները, ինչպիսիք են գերհամապատասխանությունը (որտեղ մոդելը չափազանց շատ բան է սովորում վերապատրաստման տվյալներից և վատ է աշխատում չտեսնված տվյալների վրա) և անբավարարությունը (որտեղ մոդելը չափազանց պարզ է՝ նկարագրելու օրինաչափությունները: տվյալներ):
Հայեցակարգը ներառում է առկա տվյալների բաժանումը մի քանի ենթաբազմությունների, սովորաբար երկու հիմնական մասի` ուսուցման հավաքածու և վավերացման հավաքածու (որը երբեմն նաև կոչվում է թեստային հավաքածու):
Ընդհանուր տեխնիկան k-fold cross-validation-ն է.
-
Տվյալների հավաքածուն բաժանված է մոտավորապես հավասար չափի «k» ենթաբազմությունների (կամ ծալքերի):
-
Մոդելը մարզվում է «k» անգամ՝ ամեն անգամ օգտագործելով տարբեր ծալքեր՝ որպես վավերացման հավաքածու, իսկ մնացած ծալքերը՝ որպես մարզման հավաքածու:
-
Օրինակ, 5 անգամ խաչաձև վավերացման դեպքում տվյալները բաժանվում են հինգ ենթախմբերի: Մոդելը վերապատրաստվում է հինգ անգամ՝ ամեն անգամ օգտագործելով հինգ ենթաբազմություններից մեկը՝ որպես վավերացման հավաքածու, իսկ մյուս չորսը՝ որպես ուսումնական հավաքածու:
-
Արդյունավետության ցուցանիշները (ինչպես ճշտությունը, ճշգրտությունը, հիշելը և այլն) միջինացված են այս «k» կրկնություններում՝ վերջնական կատարողականի գնահատական ստանալու համար:
Այլ ընդհանուր տեխնիկան ներառում է
Leave-One-Out Cross-validation (LOOCV)
-
Յուրաքանչյուր տվյալների կետ ծառայում է որպես վավերացման հավաքածու, և մոդելը վերապատրաստվում է մնացած տվյալների վրա:
-
Այս մեթոդը հաշվողականորեն թանկ է տվյալների մեծ հավաքածուների համար, բայց կարող է բավականին ճշգրիտ լինել, քանի որ այն օգտագործում է գրեթե բոլոր տվյալները վերապատրաստման համար:
Շերտավորված խաչաձև վավերացում
- Ապահովում է, որ յուրաքանչյուր ծալք ներկայացնում է ամբողջ տվյալների հավաքածուն: Այն պահպանում է դասերի բաշխումը յուրաքանչյուր ծալքում, ինչը օգտակար է անհավասարակշռված տվյալների հավաքածուների համար:
Խաչաձև վավերացումը կարևոր է, քանի որ այն ապահովում է մոդելի կատարողականի ավելի հուսալի գնահատում չտեսնված տվյալների վրա՝ համեմատած մեկ գնացքի փորձարկման բաժանման հետ: Այն օգնում է բացահայտելու այնպիսի խնդիրներ, ինչպիսիք են գերհամապատասխանումը կամ թերհամապատասխանումը` տրամադրելով ավելի ամուր գնահատական, թե ինչպես է մոդելը ընդհանրացվելու նոր տվյալների վրա:
Օգտագործելով խաչաձև վավերացում՝ մեքենայական ուսուցման մասնագետները կարող են ավելի լավ որոշումներ կայացնել մոդելի ընտրության, հիպերպարամետրերի թյունինգի և չտեսնված տվյալների վրա մոդելի ընդհանրացման կատարողականի գնահատման վերաբերյալ: