Navzkrižno preverjanje je kritična tehnika, ki se uporablja za ocenjevanje, kako dobro bo model deloval na novih podatkih. Primarni cilj je oceniti zmogljivost modela na način, ki zmanjša težave, kot sta prekomerno prilagajanje (kjer se model nauči preveč iz podatkov o usposabljanju in slabo deluje na nevidnih podatkih) in premajhno prilagajanje (kjer je model preveč poenostavljen, da bi zajel vzorce v podatkov).
Koncept vključuje razdelitev razpoložljivih podatkov na več podmnožic, običajno dva glavna dela: nabor za usposabljanje in nabor za preverjanje (ki se včasih imenuje tudi testni nabor).
Pogosta tehnika je k-kratna navzkrižna validacija:
-
Nabor podatkov je razdeljen na 'k' podmnožic (ali pregibov) približno enake velikosti.
-
Model se uri 'k'-krat, pri čemer se vsakič uporabi drug pregib kot niz za preverjanje, preostali zgibi pa kot učni niz.
-
Na primer, pri 5-kratnem navzkrižnem preverjanju so podatki razdeljeni na pet podnaborov. Model se uri petkrat, pri čemer se vsakič uporabi drugačna ena od petih podmnožic kot validacijski niz in druge štiri kot učni niz.
-
Meritve uspešnosti (kot so točnost, natančnost, priklic itd.) so povprečne v teh 'k' ponovitvah, da dobimo končno oceno uspešnosti.
Druge običajne tehnike vključujejo
Navzkrižno preverjanje Leave-One-Out (LOOCV)
-
Vsaka podatkovna točka služi kot validacijski niz, model pa se uri na preostalih podatkih.
-
Ta metoda je računsko draga za velike nabore podatkov, vendar je lahko precej natančna, saj uporablja skoraj vse podatke za usposabljanje.
Stratificirano navzkrižno preverjanje
- Zagotavlja, da je vsak pregib reprezentativen za celoten nabor podatkov. Ohranja porazdelitev razreda v vsakem pregibu, kar je koristno za neuravnotežene nize podatkov.
Navzkrižno preverjanje je ključnega pomena, ker zagotavlja zanesljivejšo oceno delovanja modela na nevidnih podatkih v primerjavi z eno samo preskusno delitvijo. Pomaga pri prepoznavanju težav, kot je prekomerno opremljanje ali premajhno opremljanje, tako da zagotavlja zanesljivejšo oceno, kako se bo model posplošil na nove podatke.
Z uporabo navzkrižne validacije lahko izvajalci strojnega učenja sprejemajo boljše odločitve o izbiri modela, prilagajanju hiperparametrov in ocenjevanju generalizacijske uspešnosti modela na nevidnih podatkih.