Крос-праверка - гэта метад, які выкарыстоўваецца для ацэнкі таго, наколькі добра мадэль абагульняе новыя, нябачаныя даныя. Яе асноўная мэта - ацэнка прадукцыйнасці мадэлі, прадухіленне перападбору і прадастаўленне надзейных ацэнак таго, як мадэль будзе працаваць на незалежных наборах даных.
Метадалогія
-
K-кратная перакрыжаваная праверка: гэты метад прадугледжвае разбіццё набору даных на k падмностваў/складак прыкладна аднолькавага памеру. Мадэль навучаецца k разоў, кожны раз з выкарыстаннем k-1 згінаў для навучання і астатніх для праверкі. Гэты працэс стварае k розных мадэляў і ацэнак прадукцыйнасці, звычайна шляхам асераднення вынікаў, забяспечваючы больш надзейную метрыку ацэнкі.
-
Крос-праверка з адсутнасцю аднаго (LOOCV): у LOOCV адзіная кропка даных захоўваецца ў якасці набору праверкі, а астатнія даныя выкарыстоўваюцца для навучання. Гэты працэс паўтараецца для кожнай кропкі даных, што прыводзіць да n ітэрацый (дзе n = колькасць кропак даных). Гэта вельмі вылічальна дорага, але можа даць надзейную ацэнку, асабліва з меншымі наборамі даных.
Мэта
-
Ацэнка прадукцыйнасці мадэлі: перакрыжаваная праверка дапамагае зразумець, наколькі добра мадэль працуе на нябачных дадзеных, гарантуючы, што яна не проста запомніла навучальны набор (пераабсталяванне), але і вывучыла абагульняючыя шаблоны.
-
Памяншэнне пераабсталявання: правяраючы мадэль на розных падмноствах даных, перакрыжаваная праверка дапамагае ў ідэнтыфікацыі і змякчэнні наступстваў пераабсталявання. Ён ацэньвае, наколькі добра мадэль працуе з нябачнымі дадзенымі, зводзячы да мінімуму шанцы захопу шуму або недарэчных шаблонаў.
-
Надзейныя ацэнкі абагульнення: перакрыжаваная праверка дае больш надзейныя ацэнкі прадукцыйнасці мадэлі за кошт выкарыстання некалькіх набораў праверкі, што прыводзіць да больш надзейных ацэнак здольнасці мадэлі абагульняць новыя даныя.
Перавагі і практычныя сцэнарыі
-
K-Fold CV: ён шырока выкарыстоўваецца і падыходзіць для большасці набораў даных. Аднак для вялікіх набораў даных вылічальныя выдаткі могуць быць высокімі.
-
LOOCV: ён забяспечвае найменш прадузятую ацэнку, але можа быць вылічальна дарагім і непрактычным для вялікіх набораў даных з-за вялікай колькасці ітэрацый.
Сцэнарыі
-
Малыя наборы даных: LOOCV можа быць карысным, паколькі забяспечвае надзейную ацэнку, нягледзячы на выдаткі на вылічэнні.
-
Вялікія наборы даных: K-Fold CV можа быць больш практычным з-за меншых вылічальных патрабаванняў, але пры гэтым дае надзейныя ацэнкі.
Перакрыжаваная праверка мае вырашальнае значэнне для ацэнкі прадукцыйнасці мадэлі, зніжэння перападбору і ацэнкі здольнасці мадэлі да абагульнення. Выбар метаду часта залежыць ад памеру набору даных, вылічальных рэсурсаў і ўзроўню дакладнасці, неабходнага для ацэнкі прадукцыйнасці мадэлі.