Jamba, AI21 Labs-ek sortutako adimen artifizialaren eredu berriak, AI sortzaileen ereduek dituzten testuinguru-murriztapen tipikoak gainditzen ditu, prozesatzeko ahalmen txikiagoa eskatzen duen bitartean. Industria testuingurua prozesatzeko gaitasun esanguratsuak dituzten ereduetara mugitzen ari da, eztabaida luzeagoetan koherentzia hobetzen dutenak, baina maiz prozesatzeko eskakizun handiagoaren kontura. Edo Daganek, AI21 Labs-eko produktuen arduradunak, estrategia eraginkorragoa lor daitekeela baieztatzen du eta bere azken ereduarekin, Jamba, ilustratzen du.
AI ereduen testuinguru-leihoak ezinbestekoak dira elkarrizketaren eta datuen analisiaren fluxua mantentzeko. Leiho handiagoak hobeak dira elkarrizketaren jarioa atzematen eta mantentzen, eta txikiagoek azken interakzioak azkar ahazten dituzte. AI21 Labs-en Jamba punta-puntako testuak sortzeko eta aztertzeko eredua da, datu kopuru handiak kudeatu eta hizkuntza ugari estal ditzakeena, Google-ren Gemini eta OpenAI-ren ChatGPT bezalako modelo ezagunen boterearekin parekatuz.
Jamba-ren ezaugarri aipagarri bat goi-mailako GPU bakarrean 140.000 token kudeatzeko gaitasuna da, gutxi gorabehera 210 orrialdeko eleberri baten baliokidea. Meta-ren Llama 2-rekin alderatuta, memoria-eskakizun gutxiago dituen testuinguru-leiho txikiagoa kudeatzen duena, gaitasun hau nabarmen handiagoa da.
Jamba berezia da bere arkitekturagatik, zeinak konbinatzen dituen egoera-espazio-ereduak (SSM) konbinatzen dituena, datu-sekuentzia luzeekin konputazio-eraginkortasuna ematen dutenak, arrazonamendu korapilatsuagatik aitortzen diren transformadoreekin. SSMek, hala nola kode irekiko Mamba ereduak, ereduaren eraginkortasuna eta errendimendua testuinguru luzeagoetan hobetzen duten arren, transformadoreak bikainak dira sarrerako datuen garrantzia zehazteko. Honek Jamba antzeko tamainako transformadore modeloak baino hiru aldiz eraginkorragoa egiten du.
Jamba SSM erabileraren adibide aitzindaria da eskala handiko eredu komertzialetan, errendimendu eta eraginkortasun hobeak agintzen dituena. Ikertzaileen eskura jarri zen kode irekiko lizentzia baten arabera, segurtasun neurriak eta hobekuntzak gehitzeko asmoz. Jamba-k, Daganen arabera, GPU bakarreko ereduen errendimendua guztiz eraldatzeko gaitasuna du, hau AIaren eraginkortasunean eta diseinuan aurrerapen handia izango litzateke.
Bermatu zure etorkizuna AI eta big datan Code Labs Academy-ren Data Science and AI Bootcamp aplikazio praktikoarekin.