A Jamba innovatív megközelítése a generatív AI-hoz az AI21 Labs által

Frissítve a November 19, 2024 -en 2 percek olvasása

Az AI21 Labs által létrehozott új mesterséges intelligencia-modell, a Jamba felülmúlja a generatív mesterséges intelligencia modellek tipikus környezeti korlátait, miközben kevesebb feldolgozási teljesítményt igényel. Az iparág a jelentős kontextus-feldolgozási képességekkel rendelkező modellek felé halad, amelyek javítják a koherenciát a hosszabb viták során, de gyakran a magasabb feldolgozási igények rovására mennek. Vagy Dagan, az AI21 Labs termékvezetője azt állítja, hogy hatékonyabb stratégia érhető el, és ezt a legújabb modelljükkel, a Jambával illusztrálja.

Az AI modellek kontextusablakai elengedhetetlenek a párbeszéd és az adatelemzés áramlásának megőrzéséhez. A nagyobb ablakok jobban rögzítik és fenntartják a beszélgetés folyamatát, míg a kisebbek hamar elfelejtik a közelmúltbeli interakciókat. Az AI21 Labs Jamba egy élvonalbeli szövegalkotási és -elemzési modell, amely nagy mennyiségű adat kezelésére képes, és számos nyelvet lefed, vetekedve az olyan jól ismert modellek erejével, mint a Google Gemini és az OpenAI ChatGPT.

A Jamba egyik figyelemre méltó tulajdonsága, hogy akár 140 000 tokent is képes kezelni egyetlen csúcskategóriás GPU-n – ez nagyjából egy 210 oldalas regénynek felel meg. A Meta Llama 2-höz képest, amely kisebb kontextusablakot kezel kevesebb memóriaigénnyel, ez a képesség lényegesen több.

A Jamba egyedülálló az architektúrája miatt, amely egyesíti az állapottér-modelleket (SSM), amelyek hosszú adatsorozatokkal biztosítják a számítási hatékonyságot, és a transzformátorokat bonyolult érvelésükről ismerik fel. Míg az SSM-ek, mint például a nyílt forráskódú Mamba modell, javítják a modell hatékonyságát és teljesítményét hosszabb összefüggésekben, a transzformátorok kiválóan meghatározzák a bejövő adatok relevanciáját. Ezzel a Jamba háromszor hatékonyabb, mint a hasonló méretű transzformátormodellek.

A Jamba az SSM használatának úttörő példája a nagyméretű, kereskedelmi modellekben, amely jobb teljesítményt és hatékonyságot ígér. Nyílt forráskódú licenc alatt tették elérhetővé a kutatók számára azzal a szándékkal, hogy biztonsági intézkedéseket és fejlesztéseket adnak hozzá a későbbi kiadásokhoz. Dagan szerint a Jamba képes teljesen átalakítani a modellek teljesítményét egyetlen GPU-n, ami jelentős áttörést jelentene az AI hatékonyságában és tervezésében.

Biztosítsa jövőjét a mesterséges intelligencia és a big data területén Code Labs Academy gyakorlati Data Science and AI Bootcamp segítségével.*