Jamba-ն՝ արհեստական ինտելեկտի նոր մոդելը, որը ստեղծվել է AI21 Labs-ի կողմից, հաղթահարում է տիպիկ համատեքստային սահմանափակումները, որոնք ունեն գեներատիվ AI մոդելները՝ միաժամանակ պահանջելով ավելի քիչ մշակման հզորություն: Արդյունաբերությունը շարժվում է դեպի մոդելներ, որոնք ունեն համատեքստի մշակման զգալի հնարավորություններ, որոնք բարելավում են համահունչությունը ավելի երկար քննարկումների ընթացքում, բայց հաճախ գալիս են վերամշակման ավելի բարձր պահանջների հաշվին: Կամ Դագանը՝ AI21 Labs-ի արտադրանքի առաջատարը, պնդում է, որ ավելի արդյունավետ ռազմավարություն հնարավոր է ձեռք բերել և դա ցույց է տալիս իրենց ամենավերջին մոդելի՝ Jamba-ի միջոցով:
AI մոդելների համատեքստային պատուհանները կարևոր են երկխոսության և տվյալների վերլուծության հոսքը պահպանելու համար: Ավելի մեծ պատուհանները ավելի լավ են գրավում և պահպանում խոսակցության հոսքը, մինչդեռ փոքր պատուհանները արագորեն ստիպում են մոռանալ վերջին փոխազդեցությունները: AI21 Labs' Jamba-ն տեքստի ստեղծման և վերլուծության առաջադեմ մոդել է, որը կարող է մշակել մեծ քանակությամբ տվյալներ և ծածկել բազմաթիվ լեզուներ՝ մրցակցելով հայտնի մոդելների ուժին, ինչպիսիք են Google-ի Gemini-ն և OpenAI-ի ChatGPT-ը:
Jamba-ի ուշագրավ առանձնահատկություններից մեկն այն է, որ նրա կարողությունն է կառավարել մինչև 140,000 նշան մեկ բարձրակարգ GPU-ով, ինչը մոտավորապես համարժեք է 210 էջանոց վեպի: Համեմատած Meta-ի Llama 2-ի հետ, որը կառավարում է ավելի փոքր համատեքստային պատուհան՝ ավելի քիչ հիշողության պահանջներով, այս հնարավորությունը զգալիորեն ավելի շատ է:
Jamba-ն եզակի է իր ճարտարապետությամբ, որը միավորում է պետական տիեզերական մոդելները (SSM), որոնք ապահովում են հաշվողական արդյունավետություն տվյալների երկարատև հաջորդականությամբ, տրանսֆորմատորներով, որոնք ճանաչված են իրենց բարդ հիմնավորումներով: Մինչ SSM-ները, ինչպիսին է բաց կոդով Mamba մոդելը, բարելավում են մոդելի արդյունավետությունն ու թողունակությունը ավելի երկար համատեքստերում, տրանսֆորմատորները գերազանց են որոշելու մուտքային տվյալների համապատասխանությունը: Սա Jamba-ին դարձնում է երեք անգամ ավելի արդյունավետ, քան նմանատիպ չափի տրանսֆորմատորային մոդելները:
Jamba-ն SSM-ի օգտագործման առաջնակարգ օրինակ է լայնածավալ առևտրային մոդելներում, որը խոստանում է կատարելագործվածություն և արդյունավետություն: Այն հասանելի է դարձել հետազոտողներին բաց կոդով լիցենզիայի ներքո՝ հետագա թողարկումներում անվտանգության միջոցներ և բարելավումներ ավելացնելու նպատակով: Ջամբան, ըստ Դագանի, հնարավորություն ունի ամբողջությամբ փոխակերպել մոդելի աշխատանքը միայնակ GPU-ների վրա, ինչը լուրջ առաջընթաց կլինի AI-ի արդյունավետության և դիզայնի մեջ:
Ապահովե՛ք ձեր ապագան AI-ի և մեծ տվյալների ոլորտում Code Labs Academy-ի գործնական Data Science and AI Bootcamp միջոցով: