A validação cruzada é uma técnica crítica utilizada para avaliar o desempenho de um modelo em novos dados. O objetivo principal é avaliar o desempenho de um modelo de forma a minimizar problemas como o sobreajuste ( em que o modelo aprende demasiado com os dados de treino e tem um desempenho fraco em dados não vistos) e o subajuste ( em que o modelo é demasiado simplista para captar os padrões nos dados).
O conceito envolve a divisão dos dados disponíveis em vários subconjuntos, normalmente duas partes principais: o conjunto de treino e o conjunto de validação (, que também é por vezes designado por conjunto de teste).
Uma técnica comum é a validação cruzada k-fold:
-
O conjunto de dados é dividido em 'k' subconjuntos ( ou dobras) de tamanho aproximadamente igual.
-
O modelo é treinado 'k' vezes, cada vez utilizando uma dobra diferente como conjunto de validação e as restantes dobras como conjunto de treino.
-
Por exemplo, na validação cruzada de 5 vezes, os dados são divididos em cinco subconjuntos. O modelo é treinado cinco vezes, cada vez utilizando um subconjunto diferente dos cinco subconjuntos como conjunto de validação e os outros quatro como conjunto de treino.
-
As métricas de desempenho (como a exatidão, a precisão, a recordação, etc.) são calculadas como média nestas 'k' iterações para obter uma estimativa final do desempenho.
Outras técnicas comuns incluem
Validação cruzada de saída única (LOOCV)
-
Cada ponto de dados serve como um conjunto de validação e o modelo é treinado com o resto dos dados.
-
Este método é computacionalmente dispendioso para grandes conjuntos de dados, mas pode ser bastante exato, uma vez que utiliza quase todos os dados para treino.
Validação cruzada estratificada
- Garante que cada dobra é representativa de todo o conjunto de dados. Mantém a distribuição de classes em cada dobra, o que é útil para conjuntos de dados desequilibrados.
A validação cruzada é crucial porque fornece uma estimativa mais fiável do desempenho de um modelo em dados não vistos, em comparação com uma única divisão treino-teste. Ajuda a identificar problemas como o sobreajuste ou o subajuste, fornecendo uma estimativa mais sólida da forma como o modelo se generalizará a novos dados.
Ao utilizar a validação cruzada, os profissionais de aprendizagem automática podem tomar melhores decisões sobre a seleção de modelos, a afinação de hiperparâmetros e a avaliação do desempenho de generalização de um modelo em dados não vistos.