Indicatori cheie pentru modelele de clasificare

Actualizat pe July 24, 2024 2 Minute citite

Atunci când se evaluează performanța unui model de clasificare, pot fi utilizate mai multe valori, dar trei dintre cele mai comune sunt precizia, rechemarea și scorul F1.

Precizie:

Precizia măsoară acuratețea predicțiilor pozitive făcute de model. Este calculată ca raportul dintre predicțiile pozitive adevărate și numărul total de predicții pozitive (pozitive adevărate + pozitive false). În termeni simpli, precizia răspunde la întrebarea: „Din toate elementele pe care modelul i-a prezis ca fiind pozitive, câți au fost de fapt pozitivi?”. Precizia ridicată înseamnă că atunci când modelul prezice ceva pozitiv, de obicei este corect.

Reamintim:

Recall măsoară capacitatea modelului de a identifica corect toate cazurile pozitive. Este calculat ca raportul dintre predicțiile pozitive adevărate și numărul total de instanțe pozitive reale (pozitive adevărate + negative false). În esență, recall răspunde la întrebarea: „Din toate elementele pozitive reale, câți a identificat corect modelul?”. Reamintirea ridicată indică faptul că modelul poate identifica majoritatea cazurilor pozitive.

Scor F1:

Scorul F1 este media armonică a preciziei și a reamintirii. Oferă un scor unic care echilibrează atât precizia, cât și reamintirea. Acest scor este deosebit de util atunci când doriți să găsiți un echilibru între precizie și reamintire sau când clasele sunt dezechilibrate. Scorul F1 variază de la 0 la 1, unde o valoare mai mare indică o performanță mai bună.

Când evaluați un model de clasificare, este important să luați în considerare aceste valori împreună. De exemplu, un model cu o precizie ridicată, dar cu reamintire scăzută ar putea fi prea precaut în a face predicții pozitive, în timp ce un model cu reamintire ridicată, dar cu precizie scăzută ar putea fi prea liberal în prezicerea pozitive. Scorul F1 ajută la găsirea unui echilibru între aceste două valori.

În plus, în funcție de problema și cerințele specifice, alte valori precum acuratețea, specificitatea, curba ROC (curba caracteristică de funcționare a receptorului) și AUC (aria sub curba ROC) ar putea fi, de asemenea, valoroase pentru evaluarea performanței modelului.