Кросс-валидация техникасынын күчү

Кайчылаш валидация ыкмалары
Моделди баалоо ыкмалары
Ашыкча тууралоонун алдын алуу стратегиялары
Кросс-валидация техникасынын күчү cover image

Кайчылаш валидация – бул модель жаңы маалыматтарда канчалык жакшы иштей турганын баалоо үчүн колдонулган маанилүү ыкма. Негизги максат – моделдин иштешине баа берүү, мисалы, ашыкча тууралоо (модель окуу маалыматтарынан өтө көп нерсени үйрөнүп, көрүнбөгөн маалыматтарда начар иштейт) жана жетишсиздик (мында модель моделдин үлгүлөрүн тартуу үчүн өтө жөнөкөй болгон жерде) маалыматтар).

Концепция колдо болгон маалыматтарды бир нече топко бөлүүнү камтыйт, адатта эки негизги бөлүктөн турат: окутуу топтому жана валидация топтому (ал кээде тест жыйындысы деп да аталат).

Кеңири таралган ыкма к-кабат кайчылаш текшерүү болуп саналат:

  • Берилиштер топтому болжол менен бирдей өлчөмдөгү "k" чакан топтомдорго (же бүктөлмөлөргө) бөлүнгөн.

  • Модель 'k' жолу үйрөтүлөт, ар бир жолу валидация топтому катары башка бүктөмө, ал эми калган бүктөмөлөр машыгуу топтому катары колдонулат.

  • Мисалы, 5 эселенген кайчылаш валидацияда маалыматтар беш топко бөлүнөт. Модель беш жолу окутулат, ар бир жолу валидация топтому катары беш чакан топтомдун башка бирин, ал эми калган төртүн окутуу топтому катары колдонушат.

  • Аткаруу көрсөткүчтөрү (мисалы, тактык, тактык, кайра чакырып алуу ж.б.) бул "k" итерациялары боюнча жыйынтыктоочу баалоону алуу үчүн орточо алынат.

Башка жалпы ыкмалары кирет

Бирден чыгууну кайчылаш текшерүү (LOOCV)

  • Ар бир маалымат чекити валидациялык топтом катары кызмат кылат, ал эми модель калган маалыматтар боюнча үйрөтүлөт.

  • Бул ыкма чоң маалымат топтомдору үчүн эсептөө жагынан кымбат, бирок так болушу мүмкүн, анткени ал окутуу үчүн дээрлик бардык маалыматтарды колдонот.

Stratified Cross Validation

  • Ар бир бүктөм бүт маалымат топтомун өкүлү болушун камсыздайт. Ал ар бир бүктөмдө класстын бөлүштүрүлүшүн сактайт, бул дисбаланстуу маалымат топтомдору үчүн пайдалуу.

Кайчылаш валидация өтө маанилүү, анткени ал бир поезд-сыноо бөлүүсүнө салыштырмалуу көрүнбөгөн маалыматтар боюнча моделдин иштешинин ишенимдүү баасын берет. Бул моделдин жаңы маалыматтарга кандайча жалпыланарын такыраак баасын берүү менен ашыкча тууралоо же жетишсиздик сыяктуу маселелерди аныктоого жардам берет.

Кайчылаш текшерүүнү колдонуу менен, машина үйрөнүү практиктери моделди тандоо, гиперпараметрлерди тууралоо жана көрүнбөгөн маалыматтар боюнча моделдин жалпылоо ишин баалоо боюнча жакшыраак чечим чыгара алышат.


Career Services background pattern

Карьера кызматтары

Contact Section background image

байланышта бололу

Code Labs Academy © 2024 Бардык укуктар корголгон.