K-кабат кайчылаш валидация бул моделдин иштешин баалоо үчүн колдонулган ыкма. Бул жаңы, көрүнбөгөн маалыматтарга модель канчалык деңгээлде жалпылашарын баалоо үчүн өзгөчө пайдалуу. Процесс маалымат топтомун болжол менен бирдей өлчөмдөгү "k" чакан топтомдорго же бүктөмөлөргө бөлүүнү камтыйт. Бул жерде кадамдардын бөлүштүрүлүшү:
1. Берилиштер топтомун бөлүү:
Берилиштер топтому 'k' бирдей өлчөмдөгү ички топтомдорго же бүктөмөлөргө бөлүнөт. Мисалы, сизде 1000 үлгү болсо жана "k" 5 деп тандасаңыз, ар бир бүктөмдө 200 үлгү болот.
2. Итеративдик окутуу жана баалоо:
Модель 'k' жолу үйрөтүлгөн. Ар бир итерацияда валидация топтому катары башка бүктөлмө колдонулат, ал эми калган бүктөмөлөр машыгуу үчүн колдонулат. Мисалы:
-
Итерация 1: Валидация катары 1 бүктөм, машыгуу үчүн 2ден k бүктөм
-
Итерация 2: Валидация катары 2 бүктөлүңүз, машыгуу үчүн 1 жана 3 бүктөлүңүз
-
Итерация 3: Валидация катары 3 бүктөлүңүз, 1 жана 2 бүктөмдөрү жана машыгуу үчүн 4 бүктөлүңүз
-
... жана башка бардык бүктөмөлөр валидация топтому катары колдонулганга чейин.
3. Иштин натыйжалуулугун баалоо:
Ар бир итерациядан кийин моделдин иштеши валидация топтомунда тандалган метрика (мисалы, тактык, тактык, кайра чакырып алуу ж.б.) менен бааланат. Ар бир итерациядагы өндүрүмдүүлүктүн көрсөткүчтөрү моделдин иштешинин жалпы баасын берүү үчүн орточо алынат же бириктирилет.
4. Метрикаларды бириктирүү:
Ар бир итерациядагы аткаруу көрсөткүчтөрү (мисалы, тактык упайлары) моделдин иштешине жалпы баа берүү үчүн орточо алынат же бириктирилет. Бул топтолгон метрика көрүнбөгөн маалыматтар боюнча моделдин күтүлгөн аткарууну билдирет.
Жөнөкөй поезд/сынак бөлүүсүнө караганда K-кабат кайчылаш текшерүүнүн артыкчылыктары
-
Маалыматтарды жакшыраак колдонуу: К-кабаттуу кайчылаш валидация колдо болгон маалыматтарды жакшыраак колдонот, анткени ар бир үлгү окутуу үчүн да, валидация үчүн да колдонулат.
-
Өндүрүмдүүлүктү баалоонун кыскартылган дисперсиясы: Бул бир поезд/сыноо бөлүүсүнө байланыштуу дисперсияны азайтуу аркылуу моделдин натыйжалуулугун ишенимдүүраак баалайт.
-
Жалпылаштыруу: Бул моделдин маалыматтардын ар кандай бөлүмдөрүндө кандай аткарарын түшүнүүгө жардам берет, демек, анын жалпылоо мүмкүнчүлүгүн баалайт.
'k' маанисин тандоо
-
Жогорку 'k' маанилери: Жогорку 'k' маанисин колдонуу (мисалы, 10 же андан көп) валидациялоо топтомдорунун кичирээк болушуна алып келет, бул өндүрүмдүүлүктү баалоодо азыраак бурмалоого алып келиши мүмкүн, бирок жогорураак эсептөө наркы.
-
Төмөнкү "k" маанилери: Төмөнкү "k" маанисин колдонуу (мисалы, 3 же 5) эсептөө чыгымдарын азайтат, бирок азыраак валидациядан улам натыйжалуулукту баалоодо жогорураак бурмалоого алып келиши мүмкүн топтомдору.
Практикалык сценарийлерде
-
Чоң маалымат топтомдору үчүн жогорку "k" маанилери эсептөө үчүн кымбат болушу мүмкүн.
-
Берилиштер топтому кичинекей болгондо, жогорку "k" күчтүү моделди үйрөтүү үчүн ар бир бүктөмдө жетиштүү маалыматтарды бербеши мүмкүн.
-
Жалпысынан алганда, 5 же 10 сыяктуу баалуулуктар адатта колдонулат, анткени алар эсептөө эффективдүүлүгү менен ишенимдүү аткарууну баалоо ортосунда тең салмактуулукту сактайт.