Sailkapen-eredu baten errendimendua ebaluatzean, hainbat neurketa erabil daitezke, baina ohikoenetako hiru zehaztasuna, gogorapena eta F1 puntuazioa dira.
Zehaztasuna:
Zehaztasunak ereduak egindako iragarpen positiboen zehaztasuna neurtzen du. Benetako iragarpen positiboen eta iragarpen positibo kopuru osoaren arteko erlazio gisa kalkulatzen da (egiazko positiboak + faltsuak). Termino sinpleetan, zehaztasunak galdera honi erantzuten dio: "Ereduak positibotzat jo zituen elementu guztietatik, zenbat ziren benetan positiboak?". Zehaztasun handikoak esan nahi du ereduak zerbait positiboa dela aurreikusten duenean, normalean zuzena dela.
Gogoratu:
Recall-ek ereduak instantzia positibo guztiak zuzen identifikatzeko duen gaitasuna neurtzen du. Benetako iragarpen positiboen eta benetako instantzia positiboen kopuru osoaren (egiazko positiboak + negatibo faltsuak) arteko erlazio gisa kalkulatzen da. Funtsean, gogoratzeak galderari erantzuten dio: "Benetako elementu positibo guztien artean, zenbat identifikatu ditu ereduak behar bezala?". Gogoratze altua ereduak instantzia positibo gehienak identifikatu ditzakeela adierazten du.
F1 puntuazioa:
F1 puntuazioa zehaztasunaren eta gogoratzearen batez besteko harmonikoa da. Puntuazio bakarra eskaintzen du, bai zehaztasuna eta bai oroimena orekatzen dituena. Puntuazio hau bereziki erabilgarria da zehaztasunaren eta gogoratzearen arteko oreka bilatu nahi duzunean edo klaseak desorekatuta daudenean. F1 puntuazioa 0tik 1era bitartekoa da, non balio handiagoak errendimendu hobea adierazten duen.
Sailkapen-eredu bat ebaluatzeko garaian, garrantzitsua da neurri horiek batera kontuan hartzea. Esate baterako, zehaztasun handiko baina gogorarazten duen eredu bat zuhurregia izan daiteke iragarpen positiboak egiteko, eta, berriz, gogorapen handiko baina doitasun baxua duen eredua liberalegia izan daiteke positiboak iragartzeko. F1 puntuazioak bi metrika horien arteko oreka lortzen laguntzen du.
Gainera, arazo eta eskakizun espezifikoen arabera, zehaztasuna, espezifikotasuna, ROC kurba (hargailuaren funtzionamenduaren ezaugarri kurba) eta AUC (ROC kurbaren azpian dagoen eremua) ere baliotsuak izan daitezke ereduaren errendimendua ebaluatzeko.