K-qat çarpaz doğrulama modelin performansını qiymətləndirmək üçün istifadə edilən texnikadır. Bu, modelin yeni, görünməmiş məlumatlara nə qədər ümumiləşdiriləcəyini qiymətləndirmək üçün xüsusilə faydalıdır. Proses verilənlər toplusunun təxminən bərabər ölçülü "k" alt dəstlərinə və ya qatlara bölünməsini nəzərdə tutur. Budur addımların icmalı:
1. Datasetin Parçalanması:
Verilənlər toplusu 'k' bərabər ölçülü alt çoxluqlara və ya qatlara bölünür. Məsələn, 1000 nümunəniz varsa və 5 olaraq 'k' seçsəniz, hər qatda 200 nümunə olacaq.
2. İterativ Təlim və Qiymətləndirmə:
Model 'k' dəfə öyrədilir. Hər iterasiyada doğrulama dəsti kimi fərqli bir qat istifadə olunur, qalan qatlar isə təlim üçün istifadə olunur. Məsələn:
-
İterasiya 1: Doğrulama olaraq 1 qat, məşq üçün 2-dən k-yə qatlayın
-
İterasiya 2: Doğrulama olaraq 2 qat, məşq üçün 1 və 3-ü k-yə qatlayın
-
İterasiya 3: Doğrulama olaraq 3 qat, 1 və 2 qat və məşq üçün 4-dən k-yə qatlayın
-
... və s. bütün qatlar doğrulama dəsti kimi istifadə olunana qədər.
3. Performansın Qiymətləndirilməsi:
Hər iterasiyadan sonra modelin performansı təsdiqləmə dəstində seçilmiş metrikdən (məsələn, dəqiqlik, dəqiqlik, geri çağırma və s.) istifadə edilməklə qiymətləndirilir. Hər iterasiyanın performans göstəriciləri model performansının ümumi qiymətləndirilməsini vermək üçün orta hesablanır və ya birləşdirilir.
4. Metriklərin ümumiləşdirilməsi:
Modelin performansının ümumi qiymətləndirilməsini təmin etmək üçün hər bir iterasiyanın performans göstəriciləri (məsələn, dəqiqlik balları) orta hesablanır və ya birləşdirilir. Bu məcmu metrik modelin görünməyən məlumatlar üzrə gözlənilən performansını əks etdirir.
K-qat çarpaz doğrulamanın sadə qatar/test bölgüsü ilə müqayisədə üstünlükləri
-
Məlumatın Daha Yaxşı İstifadəsi: K-qat çarpaz doğrulama mövcud məlumatdan daha yaxşı istifadə edir, çünki hər bir nümunə həm təlim, həm də doğrulama üçün istifadə olunur.
-
Performans Təxminində Azaldılmış Dəyişiklik: Bu, tək qatar/test bölgüsü ilə bağlı fərqi azaltmaqla model performansının daha etibarlı qiymətləndirilməsini təmin edir.
-
Ümumiləşdirmə: Bu, modelin verilənlərin müxtəlif alt qruplarında necə çıxış etdiyini başa düşməyə kömək edir, beləliklə, onun ümumiləşdirmə qabiliyyətini qiymətləndirir.
'k' dəyərinin seçilməsi
-
Daha yüksək 'k' Dəyərləri: Daha yüksək 'k' dəyərindən istifadə (məsələn, 10 və ya daha çox) daha kiçik doğrulama dəstləri ilə nəticələnir ki, bu da performans təxminində aşağı qərəzliliyə, lakin daha yüksək hesablama xərclərinə səbəb ola bilər..
-
Aşağı 'k' Dəyərləri: Daha aşağı 'k' dəyərindən istifadə (məsələn, 3 və ya 5) hesablama xərclərini azaldır, lakin daha kiçik doğrulama səbəbindən performans təxminində daha yüksək qərəzliliyə səbəb ola bilər dəstləri.
Praktik ssenarilərdə
-
Böyük verilənlər dəstləri üçün daha yüksək "k" dəyərləri hesablama baxımından baha ola bilər.
-
Verilənlər dəsti kiçik olduqda, daha yüksək "k" möhkəm model təlimi üçün hər qatda kifayət qədər məlumat təmin etməyə bilər.
-
Ümumiyyətlə, 5 və ya 10 kimi dəyərlər hesablama səmərəliliyi və etibarlı performans qiymətləndirilməsi arasında tarazlıq yaratdığı üçün adətən istifadə olunur.