Quan s'avalua el rendiment d'un model de classificació, es poden utilitzar diverses mètriques, però tres de les més habituals són la precisió, la recorda i la puntuació F1.
Precisió:
La precisió mesura l'exactitud de les prediccions positives fetes pel model. Es calcula com la relació entre les prediccions positives vertaderes i el nombre total de prediccions positives (positius veritables + positius falsos). En termes senzills, la precisió respon a la pregunta: "De tots els elements que el model va predir com a positius, quants eren realment positius?". L'alta precisió significa que quan el model prediu alguna cosa com a positiva, normalment és correcta.
Recorda:
La memòria mesura la capacitat del model per identificar correctament tots els casos positius. Es calcula com la relació entre les prediccions positives vertaderes i el nombre total d'instàncies positives reals (positius veritables + negatius falsos). En essència, el record respon a la pregunta: "De tots els elements positius reals, quants n'ha identificat correctament el model?". El record elevat indica que el model pot identificar la majoria dels casos positius.
Puntuació F1:
La puntuació F1 és la mitjana harmònica de precisió i record. Proporciona una puntuació única que equilibra la precisió i la memòria. Aquesta puntuació és especialment útil quan voleu trobar un equilibri entre precisió i record o quan les classes estan desequilibrades. La puntuació F1 oscil·la entre 0 i 1, on un valor més alt indica un millor rendiment.
Quan s'avalua un model de classificació, és important tenir en compte aquestes mètriques conjuntament. Per exemple, un model amb alta precisió però poca memòria podria ser massa prudent a l'hora de fer prediccions positives, mentre que un model amb gran record però poca precisió pot ser massa liberal a l'hora de predir positius. La puntuació de la F1 ajuda a trobar un equilibri entre aquestes dues mètriques.
A més, depenent del problema i els requisits específics, altres mètriques com la precisió, l'especificitat, la corba ROC (corba característica de funcionament del receptor) i l'AUC (àrea sota la corba ROC) també podrien ser valuoses per avaluar el rendiment del model.