Kruisvalidering is 'n kritieke tegniek wat gebruik word om te evalueer hoe goed 'n model op nuwe data sal presteer. Die primêre doelwit is om 'n model se prestasie te assesseer op 'n manier wat kwessies soos ooraanpassing (waar die model te veel uit die opleidingsdata leer en swak presteer op onsigbare data) en onderpassing (waar die model te simplisties is om die patrone in die data).
Die konsep behels die splitsing van die beskikbare data in verskeie substelle, tipies twee hoofdele: die opleidingstel en die valideringstel (wat ook soms die toetsstel genoem word).
'n Algemene tegniek is k-vou kruisvalidering:
-
Die datastel word verdeel in 'k' substelle (of voue) van ongeveer gelyke grootte.
-
Die model word 'k' keer opgelei, elke keer met 'n ander vou as die valideringstel en die oorblywende voue as die oefenstel.
-
Byvoorbeeld, in 5-voudige kruisvalidering, word die data in vyf substelle verdeel. Die model word vyf keer opgelei, elke keer met 'n ander een van die vyf substelle as die valideringstel en die ander vier as die opleidingstel.
-
Die prestasiemaatstawwe (soos akkuraatheid, akkuraatheid, herroeping, ens.) word oor hierdie 'k'-iterasies gemiddeld om 'n finale prestasieskatting te kry.
Ander algemene tegnieke sluit in
Laat-een-uit kruisvalidering (LOOCV)
-
Elke datapunt dien as 'n valideringsstel, en die model word op die res van die data opgelei.
-
Hierdie metode is rekenaarmatig duur vir groot datastelle, maar kan redelik akkuraat wees aangesien dit byna al die data vir opleiding gebruik.
Gestratifiseerde kruisvalidering
- Verseker dat elke vou verteenwoordigend is van die hele datastel. Dit handhaaf die klasverspreiding in elke vou, wat nuttig is vir ongebalanseerde datastelle.
Kruisvalidering is van kardinale belang omdat dit 'n meer betroubare skatting bied van 'n model se werkverrigting op ongesiene data in vergelyking met 'n enkele trein-toetsverdeling. Dit help om kwessies soos oorpas of onderpas te identifiseer deur 'n meer robuuste skatting te verskaf van hoe die model na nuwe data sal veralgemeen.
Deur kruisvalidering te gebruik, kan masjienleerpraktisyns beter besluite neem oor modelkeuse, hiperparameter-instelling en die assessering van die veralgemeningsprestasie van 'n model op onsigbare data.