Düzenlileştirme, fazla uyumu önlemek ve bir modelin genellemesini iyileştirmek için kullanılan bir dizi tekniği ifade eder. Aşırı uyum, bir model eğitim verilerini çok iyi öğrendiğinde, gürültüyü ve yeni, görünmeyen veriler için geçerli olmayan belirli ayrıntıları yakaladığında meydana gelir. Düzenleme, modelin amaç fonksiyonuna bir ceza terimi ekleyerek aşırı karmaşık modellerin cesaretini kırarak bunu kontrol etmeye yardımcı olur.
İki yaygın düzenleme türü L1 ve L2 düzenlileştirmesidir:
L1 Düzenlemesi (Kement Regresyon):
-
L1 düzenlemesi, maliyet fonksiyonuna modelin katsayılarının mutlak değerlerine eşit bir ceza terimi ekler.
-
Bazı katsayıları tam olarak sıfıra indirerek ve özellik seçimini etkili bir şekilde gerçekleştirerek modelde seyrekliği teşvik eder.
-
Ortaya çıkan model, yalnızca en önemli özellikleri seçip daha az alakalı olanları attığı için daha basit ve yorumlanması daha kolaydır.
L2 Düzenlileştirme (Ridge Regresyon):
-
L2 düzenlemesi maliyet fonksiyonuna modelin katsayılarının kare büyüklüklerine eşit bir ceza terimi ekler.
-
Daha az önemli özelliklerin katsayılarını sıfıra doğru küçültme eğilimindedir, ancak bunları nadiren tam olarak sıfıra ayarlar.
-
L2 düzenlemesi, büyük ağırlıkları cezalandırarak aşırı uyumu önlemede etkilidir ve dolayısıyla modelin karmaşıklığını azaltır.
Hem L1 hem de L2 düzenleme teknikleri, aşırı uyumun azaltılmasına ve modelin görünmeyen verilere genelleme yeteneğinin geliştirilmesine yardımcı olur. L1 ve L2 düzenlemesi arasındaki seçim genellikle spesifik soruna, özelliklerin doğasına ve istenen sonuca bağlıdır. Lasso (L1) düzenlemesi, özellik seçme özelliği ile en alakalı özelliklerin belirlenmesi gerektiğinde tercih edilmektedir. Sırt (L2) düzenlemesi, tüm özelliklerin potansiyel olarak önemli olduğu ve bunları tamamen ortadan kaldırmadan etkilerinin azaltılmasının tercih edildiği durumlarda uygundur. Ek olarak, Elastik Ağ düzenlemesi olarak bilinen her iki tekniğin bir kombinasyonu, hem L1 hem de L2 düzenlemesinden aynı anda yararlanmak için kullanılabilir.