Belangrijke statistieken voor classificatiemodellen
Bijgewerkt op June 22, 2024 2 Minuten lezen

Bij het evalueren van de prestaties van een classificatiemodel kunnen verschillende meetgegevens worden gebruikt, maar drie van de meest voorkomende zijn precisie, herinnering en de F1-score.
Precisie:
Precisie meet de nauwkeurigheid van de positieve voorspellingen van het model. Het wordt berekend als de verhouding tussen echt positieve voorspellingen en het totale aantal positieve voorspellingen (echte positieven + valse positieven). In eenvoudige bewoordingen beantwoordt precisie de vraag: “Van alle items die het model als positief voorspelde, hoeveel waren er daadwerkelijk positief?”. Hoge precisie betekent dat wanneer het model iets positiefs voorspelt, het meestal correct is.
Herinneren:
Recall meet het vermogen van het model om alle positieve gevallen correct te identificeren. Het wordt berekend als de verhouding tussen echt positieve voorspellingen en het totale aantal daadwerkelijk positieve gevallen (echte positieven + fout-negatieven). In wezen beantwoordt Recall de vraag: “Hoeveel van alle daadwerkelijke positieve items heeft het model correct geïdentificeerd?”. Een hoge herinnering geeft aan dat het model de meeste positieve gevallen kan identificeren.
F1-score:
De F1-score is het harmonische gemiddelde van precisie en herinnering. Het biedt één enkele score die zowel precisie als herinnering in evenwicht houdt. Deze score is vooral handig als je een balans wilt vinden tussen precisie en herinnering of als de lessen onevenwichtig zijn. De F1-score varieert van 0 tot 1, waarbij een hogere waarde betere prestaties aangeeft.
Bij het beoordelen van een classificatiemodel is het belangrijk om deze statistieken samen te overwegen. Een model met een hoge nauwkeurigheid maar een lage herinnering kan bijvoorbeeld te voorzichtig zijn bij het maken van positieve voorspellingen, terwijl een model met een hoge herinnering maar een lage nauwkeurigheid te liberaal kan zijn bij het voorspellen van positieve voorspellingen. De F1-score helpt om een evenwicht te vinden tussen deze twee statistieken.
Bovendien kunnen, afhankelijk van het specifieke probleem en de vereisten, andere meetgegevens zoals nauwkeurigheid, specificiteit, ROC-curve (karakteristieke curve van de ontvanger) en AUC (gebied onder de ROC-curve) ook waardevol zijn voor het beoordelen van de prestaties van het model.