Nyckelmått för klassificeringsmodeller
Uppdaterad på June 22, 2024 2 minuter läst

När man utvärderar prestandan för en klassificeringsmodell kan flera mätvärden användas, men tre av de vanligaste är precision, återkallelse och F1-poäng.
Precision:
Precision mäter noggrannheten hos de positiva förutsägelser som modellen gör. Det beräknas som förhållandet mellan sanna positiva förutsägelser och det totala antalet positiva förutsägelser (sanna positiva + falskt positiva). Enkelt uttryckt svarar precision på frågan: “Av alla poster som modellen förutspådde som positiva, hur många var faktiskt positiva?”. Hög precision innebär att när modellen förutsäger något som positivt så är det oftast korrekt.
Återkallelse:
Recall mäter modellens förmåga att korrekt identifiera alla positiva instanser. Det beräknas som förhållandet mellan sanna positiva förutsägelser och det totala antalet faktiska positiva fall (sanna positiva + falskt negativa). I huvudsak svarar recall på frågan: “Av alla faktiska positiva föremål, hur många identifierade modellen korrekt?”. Högt minne tyder på att modellen kan identifiera de flesta av de positiva fallen.
F1-poäng:
F1-poängen är det harmoniska medelvärdet av precision och återkallelse. Det ger en enda poäng som balanserar både precision och återkallelse. Den här poängen är särskilt användbar när du vill hitta en balans mellan precision och återkallelse eller när klasserna är obalanserade. F1-poäng varierar från 0 till 1, där ett högre värde indikerar bättre prestanda.
När du bedömer en klassificeringsmodell är det viktigt att överväga dessa mått tillsammans. Till exempel kan en modell med hög precision men låg precision vara alltför försiktig med att göra positiva förutsägelser, medan en modell med hög återkallelse men låg precision kan vara för liberal när det gäller att förutsäga positiva. F1-poängen hjälper till att hitta en balans mellan dessa två mätvärden.
Dessutom, beroende på det specifika problemet och kraven, kan andra mätvärden som noggrannhet, specificitet, ROC-kurva (mottagarfunktionskurva) och AUC (area under ROC-kurvan) också vara värdefulla för att bedöma modellens prestanda.