Классификациялоо моделинин натыйжалуулугун баалоодо бир нече көрсөткүчтөрдү колдонсо болот, бирок эң кеңири таралган үчөө тактык, эске алуу жана F1 балл болуп саналат.
Тактык:
Тактык модел тарабынан жасалган оң божомолдордун тактыгын өлчөйт. Ал чыныгы позитивдүү божомолдордун позитивдүү божомолдордун жалпы санына катышы катары эсептелет (чыныгы позитив + жалган позитив). Жөнөкөй сөз менен айтканда, тактык суроого жооп берет: "Модель позитивдүү деп болжолдогон нерселердин ичинен канчасы чындыгында оң болгон?". Жогорку тактык, модель бир нерсени позитивдүү деп болжолдогондо, ал адатта туура болот дегенди билдирет.
Эскертүү:
Эстөө моделдин бардык оң учурларды туура аныктоо мүмкүнчүлүгүн өлчөйт. Ал чыныгы позитивдүү божомолдордун чыныгы оң инстанциялардын жалпы санына катышы катары эсептелет (чыныгы оң + жалган терс). Маңызы боюнча, кайра чакырып алуу суроого жооп берет: "Бардык иш жүзүндөгү позитивдүү пункттардын ичинен моделдин канчасы туура аныкталды?". Жогорку кайра чакыртып алуу моделдин оң учурлардын көбүн аныктай аларын көрсөтүп турат.
F1 упай:
F1 баллы тактыктын жана кайра чакыртуунун гармоникалык орточо көрсөткүчү. Ал тактыкты жана кайра чакырууну тең салмактаган бирдиктүү упай менен камсыз кылат. Бул упай тактык менен кайра чакыруунун ортосундагы тең салмактуулукту тапкыңыз келгенде же сабактар дисбаланс болгондо өзгөчө пайдалуу. F1 баллы 0дөн 1ге чейин диапазондо, мында жогорураак маани жакшыраак иштөөнү көрсөтөт.
Классификация моделин баалоодо бул көрсөткүчтөрдү чогуу кароо маанилүү. Мисалы, жогорку тактыкка ээ, бирок кайра чакырып алуусу төмөн модель оң божомолдорду жасоодо өтө этият болушу мүмкүн, ал эми кайра чакырып алуусу жогору, бирок тактыгы төмөн модель позитивдүү нерселерди алдын ала айтууда өтө либералдуу болушу мүмкүн. F1 эсеби бул эки көрсөткүчтүн ортосундагы балансты түзүүгө жардам берет.
Кошумча, конкреттүү көйгөйгө жана талаптарга жараша тактык, өзгөчөлүк, ROC ийри сызыгы (кабылдагычтын иштөө мүнөздөмөлөрү ийри сызыгы) жана AUC (ROC ийри сызыгынын астындагы аянт) сыяктуу башка көрсөткүчтөр да моделдин иштешин баалоо үчүн баалуу болушу мүмкүн.