Uzunluk normalizasyonu, ışın arama veya diğer dizi oluşturma algoritmalarında daha kısa veya daha uzun dizilere yönelik önyargıları gidermek için kullanılan bir tekniktir. Özellikle olasılığa dayalı puanlama yöntemleri kullanıldığında, farklı uzunluktaki dizilerin adil değerlendirilmesini ve sıralanmasını sağlamayı amaçlamaktadır.
Işın araması bağlamında:
Çözülen Sorun
- Uzunluk Sapmaları: Uzunluk normalizasyonu olmadan, daha uzun diziler, yalnızca her adımdaki olasılıkların çarpımından dolayı, daha kısa dizilere kıyasla daha düşük olasılıklara sahip olma eğilimindedir. Sonuç olarak, oluşma olasılıklarının daha yüksek olması nedeniyle ışın aramada genellikle daha kısa diziler hakimdir.
Uzunluk Normalleştirmesi Nasıl Çalışır
-
Amaç: Uzunluk normalizasyonunun amacı, herhangi bir uzunluğa yönelik önyargıyı önlemek için aday dizilerin puanlarını veya olasılıklarını uzunluklarına göre ayarlamaktır.
-
Normalleştirme Faktörü: Dizilerin puanlarının, uzunluklarını dikkate alan bir faktörle ölçeklendirilmesini içerir.
-
Uzunluk Cezası: Genellikle bu, log olasılığının (veya herhangi bir puanlama ölçüsünün) dizinin uzunluğuna bölünmesini veya dizi uzunluğuyla ters orantılı bir ceza teriminin uygulanmasını içerir.
Örnek
-
Diyelim ki iki diziniz var: Dizi A'nın uzunluğu 5 ve log olasılığı -10'dur ve Dizi B'nin uzunluğu 7 ve log olasılığı -15'tir.
-
Uzunluk normalizasyonu olmadan, Dizi A'nın daha kısa olmasına rağmen daha yüksek bir olasılığa sahip olduğu görülmektedir (-10 > -15'ten beri).
-
Uzunluk normalizasyonuyla, log olasılıkları ilgili dizi uzunluklarına bölünerek puanlar ayarlanabilir: Dizi A'nın düzeltilmiş puanı -10/5 = -2 olur ve Dizi B'nin düzeltilmiş puanı -15/7 ≈ -2,14 olur.
-
Uzunluk normalizasyonundan sonra Dizi B'nin daha uzun uzunluğu göz önüne alındığında düzeltilmiş olasılığı biraz daha yüksek olabilir.
Amaç ve Etki
-
Eşit Değerlendirme: Uzunluk normalizasyonu, dizilerin uzunlukları dikkate alınarak adil değerlendirilmesini ve sıralanmasını sağlamayı ve daha kısa dizilere yönelik önyargıyı azaltmayı amaçlamaktadır.
-
Dengeli Keşif: Puanları uzunluğa göre normalleştirerek ışın arama, değişen uzunluklardaki dizileri daha eşit bir şekilde keşfedebilir ve oluşturulan çıktılarda çeşitliliği teşvik edebilir.
Dizi Oluşturmanın Önemi
-
Uzunluk normalizasyonu, çıktı dizisinin uzunluğunun önemli ölçüde değiştiği veya daha kısa veya daha uzun dizilerin tercih edilmesinin taraflı sonuçlara yol açabileceği görevlerde özellikle önemlidir.
-
Kısa, tutarlı çıktılar üretmek ile daha uzun, bağlamsal olarak daha zengin dizileri keşfetmek arasında bir denge kurmaya yardımcı olur.
Temelde, ışın aramadaki uzunluk normalizasyonu, adil bir karşılaştırma ve sıralama sağlamak için aday dizilerin puanlarını uzunluklarına göre ayarlar ve farklı uzunluklardaki dizilerin daha dengeli bir şekilde araştırılmasını teşvik eder.