Qərəz-variasiya dəyişikliyi modelin ümumiləşdirmə xətasını anlamağa kömək edən əsas konsepsiyadır.
Qərəz-Variance Dekompozisiyası
Qərəz sadələşdirilmiş model ilə real problemi təxmin etməklə təqdim edilən xətəyə istinad edir. Bu, modelimizin orta proqnozu ilə proqnozlaşdırmağa çalışdığımız düzgün dəyərarasındakıfərqi təmsil edir. Yüksək qərəz tez-tez məlumatların mürəkkəbliyini tuta bilməyən həddindən artıq sadələşdirilmiş modellərə səbəb olur.
Varians isə modelin verilənlər dəstindəki dalğalanmalara həssaslığını ölçür. O, müxtəlif verilənlər dəstləri üzərində öyrədilsəydi, modelin proqnozlarının nə qədər dəyişəcəyini müəyyən edir. Yüksək variasiya həddən artıq uyğunlaşmaya gətirib çıxara bilər—təlim məlumatlarında yaxşı çıxış edən, lakin yeni, görünməmiş məlumatlara zəif ümumiləşən modellər.
Mübadilə və Model Mürəkkəbliyi ilə Əlaqə
Qərəz və variasiya arasındakı mübadilə çox vacibdir. Model mürəkkəbliyi artdıqca, qərəzlilik adətən azalır (model daha mürəkkəb nümunələri tuta bilər), lakin variasiya artmağa meyllidir (model səs-küyə və təlim məlumatlarının xüsusiyyətlərinə daha həssas olur). Bu iki komponentin balanslaşdırılması optimal model performansına nail olmaq üçün açardır.
Səhv töhfəsi və hesablanması
Gözlənilən proqnoz xətası üç hissəyə bölünə bilər:
-
Azaldılmayan xəta (səs-küy)
-
Qərəz kvadratı
-
Fərqlilik
Riyazi olaraq:
Gözlənilən Xəta = Azaldılmayan Xəta + Qərəz2+ Dəyişiklik
Yanlışlığın və fərqin birbaşa hesablanması mürəkkəb ola bilər, xüsusən də real dünya məlumatları üçün. çarpaz doğrulama, öyrənmə əyriləri və ya təlim və yoxlama üçün verilənlər bazasının müxtəlif alt dəstlərindən istifadə kimi texnikalar bu komponentləri qiymətləndirməyə kömək edə bilər.
Yüksək qərəzliliyi və ya yüksək dəyişkənliyi həll etmək üçün strategiyalar
-
Yüksək qərəz: Yüksək qərəzliyi azaltmaq üçün daha mürəkkəb modellərdən istifadə etməklə (məsələn, xətti modellər əvəzinə neyron şəbəkələrindən istifadə etməklə, daha çox funksiya əlavə etməklə) model mürəkkəbliyini artırmaq olar.
-
Yüksək Dəyişkənlik: Yüksək fərqliliyi aradan qaldırmaq üçün tənzimləmə (məsələn, Lasso, Ridge), model mürəkkəbliyinin azaldılması (xüsusiyyət seçimi, ölçülərin azaldılması) və ya daha çox məlumat toplama kimi üsullar faydalı ola bilər.
Təhlil vasitəsilə təkmilləşdirmə
Qərəz-variasiya mübadilələrini təhlil edərək, biz modelin davranışı ilə bağlı fikirlər əldə edə bilərik. Problem üçün uyğun mürəkkəblik səviyyəsini seçə, modelin uyğun olub olmadığını anlaya və performansı yaxşılaşdırmaq üçün müvafiq strategiyaları tətbiq edə bilərik.
Məsələn, əgər model yüksək dispersiya göstərirsə, biz xüsusiyyətlərin sayını azaltmaqla və ya nizamlanma üsullarından istifadə etməklə onu sadələşdirməyi nəzərdən keçirə bilərik. Əksinə, yüksək qərəzlilik göstərərsə, daha mürəkkəb modeldən istifadə etmək və ya daha uyğun funksiyalar əlavə etmək kömək edə bilər.
Nəhayət, məqsəd görünməyən məlumatlara yaxşı ümumiləşən modellər yaratmaq üçün qərəz və variasiya arasında tarazlıq yaratmaqdır.