Крос-праверка - найважнейшы метад, які выкарыстоўваецца для ацэнкі наколькі добра мадэль будзе працаваць на новых дадзеных. Асноўная мэта складаецца ў тым, каб ацаніць прадукцыйнасць мадэлі такім чынам, каб звесці да мінімуму такія праблемы, як пераабсталяванне (калі мадэль занадта шмат вучыцца з даных навучання і дрэнна працуе з нябачнымі данымі) і недастатковае абсталяванне (калі мадэль занадта спрошчаная, каб выявіць заканамернасці ў дадзеныя).
Канцэпцыя прадугледжвае разбіванне даступных даных на некалькі падмностваў, як правіла, на дзве асноўныя часткі: навучальны набор і набор праверкі (які таксама часам называюць тэставым наборам).
Распаўсюджаная тэхніка - шматразовая перакрыжаваная праверка:
-
Набор даных падзелены на «k» падмностваў (або складак) прыкладна аднолькавага памеру.
-
Мадэль навучаецца 'k' разоў, кожны раз з выкарыстаннем розных згінаў у якасці набору для праверкі, а астатнія згіны ў якасці набору для навучання.
-
Напрыклад, пры 5-кратнай перакрыжаванай праверцы даныя дзеляцца на пяць падмностваў. Мадэль навучаецца пяць разоў, кожны раз з выкарыстаннем аднаго з пяці падмностваў у якасці набору праверкі, а астатнія чатыры - у якасці навучальнага набору.
-
Паказчыкі прадукцыйнасці (напрыклад, дакладнасць, дакладнасць, запамінанне і г.д.) усярэднія па гэтых «k» ітэрацый, каб атрымаць канчатковую ацэнку прадукцыйнасці.
Іншыя распаўсюджаныя метады ўключаюць
Перакрыжаваная праверка Leave-One-Out (LOOCV)
-
Кожная кропка дадзеных служыць наборам праверкі, а мадэль навучаецца на астатніх дадзеных.
-
Гэты метад з'яўляецца дарагім у плане вылічэнняў для вялікіх набораў даных, але можа быць даволі дакладным, паколькі ён выкарыстоўвае амаль усе даныя для навучання.
Стратыфікаваная перакрыжаваная праверка
- Гарантуе, што кожны складок з'яўляецца рэпрэзентатыўным для ўсяго набору даных. Ён захоўвае размеркаванне класаў у кожнай згортцы, што карысна для незбалансаваных набораў даных.
Перакрыжаваная праверка мае вырашальнае значэнне, таму што яна дае больш надзейную ацэнку прадукцыйнасці мадэлі на непраглядных дадзеных у параўнанні з адзінкавым тэстам. Гэта дапамагае ў выяўленні такіх праблем, як пераабсталяванне або недаабсталяванне, даючы больш дакладныя ацэнкі таго, як мадэль будзе абагульняцца для новых даных.
Выкарыстоўваючы перакрыжаваную праверку, практыкі машыннага навучання могуць прымаць лепшыя рашэнні аб выбары мадэлі, наладзе гіперпараметраў і ацэнцы эфектыўнасці абагульнення мадэлі на нябачных дадзеных.