Ашыкча тууралоо жана жетишсиздик - машина үйрөнүү моделдериндеги кеңири таралган маселелер, бул алардын жаңы, көрүнбөгөн маалыматтарга жакшы жалпылоо жөндөмүнө таасир этет.
Ашыкча жабдылышы модель машыгуу маалыматтарындагы негизги схемаларды гана үйрөнбөстөн, шууну жана ал маалыматтарда болгон кокустук термелүүлөрдү үйрөнгөндө пайда болот. Натыйжада, модель машыгуу маалыматтарын өзгөчө жакшы аткарат, бирок жаңы, көрүнбөгөн маалыматтарга жалпылай албайт, анткени ал машыгуу топтомун жаттап алган.
Underfitting, экинчи жагынан, модель өтө жөнөкөй болгондо, машыгуу маалыматтарындагы негизги үлгүлөрдү тартууга болот. Ал окуу маалыматтарында гана эмес, жаңы маалыматтарда да начар иштейт, анткени ал маалыматтарда болгон мамилелерди жана татаалдыктарды үйрөнө албайт.
Ашыкча жана туура эмес болууга кантип жол бербөө керек
-
Кайчылаш валидация: Маалыматтын ар кандай бөлүмдөрүндө моделдин иштешин баалоо үчүн k-кабат кайчылаш валидация сыяктуу ыкмаларды колдонуңуз. Бул модель жаңы маалыматтарга канчалык деңгээлде жалпылашарын баалоого жардам берет.
-
Тренинг-тесттин бөлүнүшү: Дайындарыңызды өзүнчө окутуу жана тестирлөө топтомуна бөлүңүз. Тренинг топтомунда моделди үйрөтүңүз жана тесттик топтомдо анын иштешине баа бериңиз. Бул моделдин көрүнбөгөн маалыматтарга канчалык деңгээлде жалпыланганын баалоого жардам берет.
-
Функцияны тандоо/кичирейтүү: Берилиштердин өлчөмдүүлүгүн азайтуу үчүн эң ылайыктуу функцияларды гана тандоо же негизги компоненттик анализ (PCA) сыяктуу ыкмаларды колдонуу менен моделдин татаалдыгын азайтыңыз.
-
Регуляризация: L1 же L2 регуляризациясы сыяктуу техникалар моделдин максаттуу функциясына татаалдыгы үчүн айыптарды кошуп, анын берилиштерге ызы-чуу менен өтө тыгыз туура келишине жол бербейт.
-
Ансамблдин ыкмалары: Ашыкча жана жетишсиздикти азайтуу үчүн бир нече моделдерди бириктириңиз. Каптоо, күчтөндүрүү же тизүү сыяктуу техникалар жалпы аткарууну жана жалпылоону жакшыртуу үчүн бир нече моделдерди колдонушат.
-
Гиперпараметрлерди тюнинг: сетка издөө же кокус издөө сыяктуу ыкмаларды колдонуу менен моделдин гиперпараметрлерин (мисалы, үйрөнүү ылдамдыгы, чечим дарактарындагы дарактардын тереңдиги ж.б.) тууралоо жана дисперсия.
-
Эрте токтотуу: Тренинг учурунда валидация топтому боюнча моделдин иштешине көз салыңыз жана көрсөткүчтөр начарлай баштаганда машыгуу процессин токтотуңуз, ошентип ашыкча тууралоону алдын алыңыз.
-
Көбүрөөк маалымат: Маалыматтын көлөмүн көбөйтүү негизги бөлүштүрүүнүн ар түрдүү жана репрезентативдик үлгүсүн камсыз кылуу менен моделди жакшыраак жалпылоого жардам берет.
Моделдин татаалдыгы менен жалпылоонун ортосундагы туура балансты табуу ашыкча жана жетишсиздиктин алдын алуу үчүн абдан маанилүү жана бул ыкмалар ошол тең салмактуулукка жетишүүгө жардам берет.