Jambos novatoriškas požiūris į generatyvųjį AI, kurį sukūrė AI21 Labs

Jambos novatoriškas požiūris į generatyvųjį AI, kurį sukūrė AI21 Labs

Jamba, naujas dirbtinio intelekto modelis, sukurtas AI21 Labs, įveikia įprastus konteksto suvaržymus, kuriuos turi generatyvieji AI modeliai, o jiems reikia mažiau apdorojimo galios. Pramonė pereina prie modelių su reikšmingomis konteksto apdorojimo galimybėmis, kurie pagerina nuoseklumą ilgesnių diskusijų metu, bet dažnai patiria didesnius apdorojimo poreikius. Arba Daganas, „AI21 Labs“ produkto vadovas, tvirtina, kad galima pasiekti efektyvesnę strategiją, ir iliustruoja tai naujausiu modeliu „Jamba“.

AI modelių kontekstiniai langai yra būtini norint išsaugoti dialogo ir duomenų analizės srautą. Didesni langai geriau fiksuoja ir palaiko pokalbio srautą, o mažesni langai greitai pamiršta neseniai įvykusias sąveikas. „AI21 Labs“ „Jamba“ yra pažangiausias teksto kūrimo ir analizės modelis, galintis apdoroti didelius duomenų kiekius ir apimantis daugybę kalbų, konkuruojantis su gerai žinomų modelių, tokių kaip „Google“ „Gemini“ ir „OpenAI“ „ChatGPT“, galia.

Viena pastebimų „Jamba“ ypatybių yra galimybė valdyti iki 140 000 žetonų viename aukščiausios klasės GPU – maždaug tai atitinka 210 puslapių romaną. Palyginti su „Meta's Llama 2“, kuri valdo mažesnį konteksto langą su mažiau atminties poreikio, ši galimybė yra daug didesnė.

Jamba yra unikali dėl savo architektūros, kuri sujungia būsenos erdvės modelius (SSM), kurie užtikrina skaičiavimo efektyvumą su ilgomis duomenų sekomis, su transformatoriais, pripažintais dėl sudėtingo samprotavimo. Nors SSM, pvz., atvirojo kodo modelis Mamba, pagerina modelio efektyvumą ir pralaidumą ilgesniuose kontekstuose, transformatoriai puikiai padeda nustatyti gaunamų duomenų tinkamumą. Dėl to Jamba tris kartus efektyvesnis nei panašaus dydžio transformatorių modeliai.

Jamba yra novatoriškas SSM naudojimo didelio masto komerciniuose modeliuose pavyzdys, žadantis geresnį našumą ir efektyvumą. Jis buvo prieinamas tyrėjams pagal atvirojo kodo licenciją, siekiant įtraukti saugos priemones ir patobulinimus vėlesniuose leidimuose. „Jamba“, pasak Dagano, turi galimybę visiškai pakeisti modelio veikimą pavieniuose GPU, o tai būtų didelis proveržis dirbtinio intelekto efektyvumo ir dizaino srityje.


  • Apsaugokite savo ateitį dirbtinio intelekto ir didelių duomenų srityje naudodami Code Labs Academy praktinę programą Data Science and AI Bootcamp.*

Code Labs Academy © 2025 Visos teisės saugomos.