AI21 Labs'tan Jamba'nın Üretken Yapay Zekaya Yenilikçi Yaklaşımı

AI21 Labs'tan Jamba'nın Üretken Yapay Zekaya Yenilikçi Yaklaşımı

AI21 Labs tarafından oluşturulan yeni bir yapay zeka modeli olan Jamba, daha az işlem gücü gerektirirken üretken yapay zeka modellerinin sahip olduğu tipik bağlam kısıtlamalarının üstesinden gelir. Sektör, daha uzun tartışmalarda tutarlılığı artıran ancak çoğu zaman daha yüksek işleme taleplerinin pahasına gelen, önemli bağlam işleme yeteneklerine sahip modellere doğru ilerliyor. Veya AI21 Labs'ın ürün lideri Dagan, daha etkili bir stratejinin ulaşılabilir olduğunu ileri sürüyor ve bunu en son modelleri Jamba ile gösteriyor.

Yapay zeka modellerinin bağlam pencereleri, diyalog ve veri analizi akışını korumak için gereklidir. Daha büyük pencereler konuşma akışını yakalama ve sürdürme konusunda daha iyiyken, daha küçük pencereler kişinin son etkileşimleri hızla unutmasına neden olur. AI21 Labs'ın Jamba'sı, büyük miktarda veriyi işleyebilen ve çok sayıda dili kapsayabilen, Google'ın Gemini ve OpenAI'nin ChatGPT'si gibi iyi bilinen modellerin gücüne rakip olabilecek son teknoloji ürünü bir metin oluşturma ve analiz modelidir.

Jamba'nın dikkate değer bir özelliği, tek bir ileri teknoloji GPU'da 140.000'e kadar jetonu yönetme yeteneğidir; bu, kabaca 210 sayfalık bir romana eşdeğerdir. Daha az bellek gereksinimiyle daha küçük bir bağlam penceresini yöneten Meta'nın Llama 2'si ile karşılaştırıldığında bu yetenek çok daha fazladır.

Jamba, uzun veri dizileriyle bilgi işlem verimliliği sağlayan durum alanı modellerini (SSM'ler) karmaşık akıl yürütmeleriyle tanınan transformatörlerle birleştiren mimarisi nedeniyle benzersizdir. Açık kaynaklı Mamba modeli gibi SSM'ler, modelin verimliliğini ve daha uzun bağlamlarda verimi artırırken, transformatörler gelen verilerin uygunluğunu belirlemede mükemmeldir. Bu, Jamba'yı benzer boyutlu transformatör modellerine göre üç kat daha verimli hale getirir.

Jamba, gelişmiş performans ve verimlilik vaat eden büyük ölçekli ticari modellerde SSM kullanımının öncü bir örneğidir. Daha sonraki sürümlere güvenlik önlemleri ve iyileştirmeler eklemek amacıyla açık kaynak lisansı altında araştırmacıların kullanımına sunuldu. Dagan'a göre Jamba, tek GPU'lardaki model performansını tamamen dönüştürme yeteneğine sahip ve bu, yapay zekanın verimliliği ve tasarımında büyük bir atılım olacak.


Code Labs Academy'ın uygulamalı Veri Bilimi ve Yapay Zeka Eğitim Kampı ile yapay zeka ve büyük verilerdeki geleceğinizi güvence altına alın.

Code Labs Academy © 2025 Her hakkı saklıdır.