Ao avaliar o rendemento dun modelo de clasificación, pódense utilizar varias métricas, pero tres das máis comúns son precisión, recorda e a puntuación F1.
Precisión:
A precisión mide a precisión das predicións positivas feitas polo modelo. Calcúlase como a relación entre as verdadeiras predicións positivas e o número total de predicións positivas (verdaderos positivos + falsos positivos). En termos sinxelos, a precisión responde á pregunta: "De todos os elementos que o modelo predixo como positivos, cantos foron realmente positivos?". A alta precisión significa que cando o modelo prevé algo positivo, normalmente é correcto.
Lembra:
A lembranza mide a capacidade do modelo para identificar correctamente todas as instancias positivas. Calcúlase como a relación entre as predicións positivas verdadeiras e o número total de instancias positivas reais (verdaderos positivos + falsos negativos). En esencia, a lembranza responde á pregunta: "De todos os elementos positivos reais, cantos identificou correctamente o modelo?". Un alto recordo indica que o modelo pode identificar a maioría dos casos positivos.
Puntuación F1:
A puntuación F1 é a media harmónica de precisión e lembranza. Ofrece unha única puntuación que equilibra a precisión e a lembranza. Esta puntuación é especialmente útil cando queres atopar un equilibrio entre precisión e lembranza ou cando as clases están desequilibradas. A puntuación F1 varía de 0 a 1, onde un valor máis alto indica un mellor rendemento.
Ao avaliar un modelo de clasificación, é importante considerar estas métricas en conxunto. Por exemplo, un modelo con alta precisión pero pouca lembranza pode ser excesivamente cauteloso á hora de facer predicións positivas, mentres que un modelo con alta precisión pero baixa precisión pode ser demasiado liberal á hora de predicir positivos. A puntuación da F1 axuda a lograr un equilibrio entre estas dúas métricas.
Ademais, dependendo do problema e dos requisitos específicos, outras métricas como a precisión, a especificidade, a curva ROC (curva característica de funcionamento do receptor) e AUC (área baixo a curva ROC) tamén poden ser valiosas para avaliar o rendemento do modelo.