Validasi silang adalah teknik penting yang digunakan untuk mengevaluasi seberapa baik performa model pada data baru. Tujuan utamanya adalah menilai performa model dengan cara yang meminimalkan masalah seperti overfitting (saat model belajar terlalu banyak dari data pelatihan dan berperforma buruk pada data yang tidak terlihat) dan underfitting (saat model terlalu sederhana untuk menangkap pola dalam model). data).
Konsep ini melibatkan pemisahan data yang tersedia menjadi beberapa subset, biasanya dua bagian utama: set pelatihan dan set validasi (yang terkadang juga disebut set pengujian).
Teknik yang umum adalah validasi silang k-fold:
-
Kumpulan data dibagi menjadi himpunan bagian (atau lipatan) 'k' dengan ukuran yang kira-kira sama.
-
Model dilatih 'k' kali, setiap kali menggunakan lipatan berbeda sebagai set validasi dan lipatan sisanya sebagai set pelatihan.
-
Misalnya, dalam validasi silang 5 kali lipat, data dibagi menjadi lima subset. Model dilatih sebanyak lima kali, setiap kali menggunakan salah satu dari lima subset yang berbeda sebagai set validasi dan empat subset lainnya sebagai set pelatihan.
-
Metrik kinerja (seperti akurasi, presisi, perolehan, dll.) dirata-ratakan pada iterasi 'k' ini untuk mendapatkan perkiraan kinerja akhir.
Teknik umum lainnya termasuk
Validasi Silang Tinggalkan Satu Keluar (LOOCV)
-
Setiap titik data berfungsi sebagai kumpulan validasi, dan model dilatih pada data lainnya.
-
Metode ini mahal secara komputasi untuk kumpulan data yang besar namun cukup akurat karena menggunakan hampir semua data untuk pelatihan.
Validasi Silang Berstrata
- Memastikan bahwa setiap lipatan mewakili keseluruhan kumpulan data. Ini mempertahankan distribusi kelas di setiap lipatan, yang berguna untuk kumpulan data yang tidak seimbang.
Validasi silang sangat penting karena memberikan estimasi performa model yang lebih andal pada data yang tidak terlihat dibandingkan dengan pemisahan pengujian pelatihan tunggal. Hal ini membantu dalam mengidentifikasi masalah seperti overfitting atau underfitting dengan memberikan estimasi yang lebih kuat tentang bagaimana model akan digeneralisasikan ke data baru.
Dengan menggunakan validasi silang, praktisi pembelajaran mesin dapat membuat keputusan yang lebih baik tentang pemilihan model, penyesuaian hyperparameter, dan menilai kinerja generalisasi model pada data yang tidak terlihat.