Джамба, AI21 Labs тарабынан түзүлгөн жаңы жасалма интеллект модели, генеративдик AI моделдери азыраак иштетүү күчүн талап кылган типтүү контексттик чектөөлөрдү жеңет. Өнөр жай контекстти иштетүүнүн олуттуу мүмкүнчүлүктөрү бар моделдерге карай жылып жатат, алар узак талкууларда ырааттуулукту жакшыртат, бирок көбүнчө кайра иштетүү талаптарынын жогорулашынын эсебинен келип чыгат. Же Даган, AI21 Labs компаниясынын продуктуну жетектөөчүсү, натыйжалуураак стратегияны ишке ашырууга болорун ырастап, аны акыркы модели Жамба менен сүрөттөйт.
AI моделдеринин контексттик терезелери диалогдун жана маалыматтарды талдоо агымын сактоо үчүн абдан маанилүү. Чоңураак терезелер сүйлөшүү агымын жакшыраак чагылдырат, ал эми кичирээк терезелер жакында болгон карым-катнаштарды тез эле унутуп коёт. AI21 Labs' Jamba — бул Google'дун Gemini жана OpenAI's ChatGPT сыяктуу белгилүү моделдердин күчү менен атаандашып, чоң көлөмдөгү маалыматтарды иштете ала турган жана көптөгөн тилдерди камтый турган заманбап текст түзүү жана талдоо модели.
Джамбанын көрүнүктүү бир өзгөчөлүгү - анын 140,000ге чейин токендерди бир жогорку деңгээлдеги GPUде башкаруу жөндөмдүүлүгү - болжол менен 210 беттик романга барабар. Meta's Llama 2 менен салыштырганда, ал азыраак эстутум талаптары менен кичиирээк контексттик терезени башкарат, бул мүмкүнчүлүк кыйла көп.
Джамба архитектурасы менен уникалдуу болуп саналат, ал мамлекеттик космос моделдерин (SSMs) айкалыштырат, алар узак маалыматтар ырааттуулугу менен эсептөө эффективдүүлүгүн камсыз кылат, трансформаторлор татаал ой жүгүртүүсү менен таанылган. SSMs, мисалы, ачык булак модели Mamba, моделдин натыйжалуулугун жана узак контексттерде өткөрүү жөндөмдүүлүгүн жакшыртса, трансформаторлор келген маалыматтардын актуалдуулугун аныктоодо эң сонун. Бул Жамбаны окшош өлчөмдөгү трансформатордук моделдерге караганда үч эсе натыйжалуу кылат.
Жамба жакшыртылган аткарууну жана натыйжалуулукту убада кылган масштабдуу, коммерциялык моделдерде SSM колдонуунун пионердик мисалы болуп саналат. Ал кийинки чыгарылыштарда коопсуздук чараларын жана жакшыртууларды кошуу максатында ачык булак лицензиясы боюнча изилдөөчүлөргө жеткиликтүү болгон. Жамба, Дагандын айтымында, моделдин иштешин жалгыз GPUларда толугу менен өзгөртүү мүмкүнчүлүгүнө ээ, бул AIнын эффективдүүлүгүндө жана дизайнында чоң ачылыш болмок.
Code Labs Academy колдонмосу Data Science and AI Bootcamp менен AI жана чоң берилиштердеги келечегиңизди коргоңуз.