Validació creuada K-fold en aprenentatge automàtic

Actualitzat a August 31, 2024 3 minuts de lectura

La validació creuada de plecs en K és una tècnica que s'utilitza per avaluar el rendiment d'un model. És especialment útil per estimar com de bé es generalitzarà un model a dades noves i no vistes. El procés consisteix a dividir el conjunt de dades en "k" subconjunts o plecs de mida aproximadament igual. Aquí teniu un desglossament dels passos:

1. Divisió del conjunt de dades:

El conjunt de dades es divideix en "k" subconjunts o plecs de la mateixa mida. Per exemple, si teniu 1.000 mostres i trieu "k" com a 5, cada plec contindrà 200 mostres.

2. Formació i avaluació iterativa:

El model s'entrena 'k' vegades. En cada iteració, s'utilitza un plec diferent com a conjunt de validació i els plecs restants s'utilitzen per a l'entrenament. Per exemple:

Iteració 1: Plega 1 com a validació, Plega 2 a k per a l'entrenament
Iteració 2: Plega 2 com a validació, Plega 1 i 3 a k per a l'entrenament
Iteració 3: Plega 3 com a validació, Plegues 1 i 2 i 4 a k per a l'entrenament
... i així successivament fins que tots els plecs s'hagin utilitzat com a conjunt de validació.

3. Avaluació del rendiment:

Després de cada iteració, el rendiment del model s'avalua mitjançant una mètrica escollida (per exemple, precisió, precisió, recordatori, etc.) al conjunt de validació. Les mètriques de rendiment de cada iteració es fan una mitjana o es combinen per donar una estimació global del rendiment del model.

4. Agregació de mètriques:

Les mètriques de rendiment (per exemple, puntuacions de precisió) de cada iteració es fan una mitjana o es combinen per proporcionar una avaluació global del rendiment del model. Aquesta mètrica agregada representa el rendiment esperat del model en dades no vistes.

Avantatges de la validació creuada de plecs en K sobre una divisió simple de tren/prova

Millor ús de les dades: la validació creuada K-fold fa un millor ús de les dades disponibles, ja que cada mostra s'utilitza tant per a la formació com per a la validació.
Variància reduïda en l'estimació del rendiment: proporciona una estimació més fiable del rendiment del model reduint la variància associada a una divisió únic tren/prova.
Generalització: ajuda a entendre com funciona el model en diferents subconjunts de dades, per tant avaluant la seva capacitat de generalització.

Escollint el valor de 'k'

Valors "k" més alts: l'ús d'un valor "k" més alt (p. ex., 10 o més) dóna com a resultat conjunts de validació més petits, que poden provocar un biaix més baix en l'estimació de rendiment però cost computacional més elevat..
Valors "k" més baixos: l'ús d'un valor "k" més baix (p. ex. 3 o 5) redueix la despesa computacional però pot provocar un biaix més elevat en l'estimació de rendiment a causa d'una validació més petita conjunts.

En escenaris pràctics

Per a grans conjunts de dades, els valors "k" més alts poden ser costosos computacionalment.
Quan el conjunt de dades és petit, pot ser que una "k" més alta no proporcioni prou dades a cada plec per a un entrenament robust del model.
En general, valors com 5 o 10 s'utilitzen habitualment, ja que aconsegueixen un equilibri entre l'eficiència computacional i l'estimació fiable del rendiment.