A validación cruzada de veces en K é unha técnica que se usa para avaliar o rendemento dun modelo. É particularmente útil para estimar que tan ben se xeneralizará un modelo a datos novos e non vistos. O proceso implica dividir o conxunto de datos en "k" subconxuntos ou dobras de tamaño aproximadamente igual. Aquí tes un desglose dos pasos:
1. División do conxunto de datos:
O conxunto de datos divídese en "k" subconxuntos ou pregamentos de igual tamaño. Por exemplo, se tes 1.000 mostras e escolles "k" como 5, cada dobra conterá 200 mostras.
2. Formación e avaliación iterativas:
O modelo adestrase 'k' veces. En cada iteración, utilízase unha dobra diferente como conxunto de validación e as restantes úsanse para adestrar. Por exemplo:
-
Iteración 1: Dobra 1 como validación, Dobra 2 a k para adestramento
-
Iteración 2: Dobra 2 como validación, Dobra 1 e 3 a k para adestramento
-
Iteración 3: Dobra 3 como validación, Dobra 1 e 2 e 4 a k para adestramento
-
... e así sucesivamente ata que todas as dobras sexan utilizadas como conxunto de validación.
3. Avaliación do rendemento:
Despois de cada iteración, o rendemento do modelo avalíase mediante unha métrica escollida (por exemplo, exactitude, precisión, lembranza, etc.) no conxunto de validación. As métricas de rendemento de cada iteración promedian ou combínanse para dar unha estimación global do rendemento do modelo.
4. Agregación de métricas:
As métricas de rendemento (por exemplo, puntuacións de precisión) de cada iteración promedian ou combínanse para proporcionar unha avaliación global do rendemento do modelo. Esta métrica agregada representa o rendemento esperado do modelo en datos non vistos.
Vantaxes da validación cruzada K-fold fronte a unha simple división de tren/proba
-
Mellor uso dos datos: a validación cruzada K-fold fai un mellor uso dos datos dispoñibles xa que cada mostra utilízase tanto para adestramento como para validación.
-
Variancia reducida na estimación do rendemento: proporciona unha estimación máis fiable do rendemento do modelo reducindo a varianza asociada a unha única división de tren/proba.
-
Xeneralización: axuda a comprender como funciona o modelo en diferentes subconxuntos de datos, avaliando así a súa capacidade de xeneralización.
Escollendo o valor de 'k'
-
Valores "k" máis altos: o uso dun valor "k" máis alto (por exemplo, 10 ou máis) resulta en conxuntos de validación máis pequenos, o que pode levar a un sesgo máis baixo na estimación de rendemento pero a un custo computacional máis elevado. **.
-
Valores "k" máis baixos: o uso dun valor "k" máis baixo (por exemplo, 3 ou 5) reduce o gasto computacional pero pode provocar un sesgo maior na estimación de rendemento debido a unha validación máis pequena conxuntos.
En escenarios prácticos
-
Para conxuntos de datos grandes, valores de 'k' máis altos poden ser computacionalmente caros.
-
Cando o conxunto de datos é pequeno, é posible que unha "k" máis alta non proporcione datos suficientes en cada dobra para un adestramento sólido do modelo.
-
Xeralmente, úsanse habitualmente valores como 5 ou 10 xa que logran un equilibrio entre a eficiencia computacional e a estimación fiable do rendemento.