Jamba, AI21 Labsin luoma uusi tekoälymalli, voittaa generatiivisten tekoälymallien tyypilliset kontekstirajoitukset, mutta vaatii vähemmän prosessointitehoa. Teollisuus on siirtymässä kohti malleja, joissa on merkittäviä kontekstinkäsittelyominaisuuksia, jotka parantavat johdonmukaisuutta pitkien keskustelujen aikana, mutta tulevat usein korkeampien käsittelyvaatimusten kustannuksella. Tai Dagan, AI21 Labsin tuotejohtaja, vakuuttaa, että tehokkaampi strategia on saavutettavissa, ja havainnollistaa sitä uusimmalla mallillaan, Jamballa.
Tekoälymallien kontekstiikkunat ovat välttämättömiä dialogin ja data-analyysin sujuvuuden säilyttämiseksi. Suuremmat ikkunat tallentavat ja ylläpitävät paremmin keskustelun kulkua, kun taas pienemmät ikkunat unohtavat nopeasti viimeaikaiset vuorovaikutukset. AI21 Labsin Jamba on huippuluokan tekstinluonti- ja -analyysimalli, joka pystyy käsittelemään suuria tietomääriä ja kattamaan useita kieliä. Se kilpailee tunnetuilla malleilla, kuten Googlen Gemini ja OpenAI:n ChatGPT.
Yksi Jamban huomionarvoinen ominaisuus on sen kyky hallita jopa 140 000 merkkiä yhdellä huippuluokan grafiikkasuorittimella – mikä vastaa suunnilleen 210-sivuista romaania. Verrattuna Metan Llama 2:een, joka hallitsee pienempää kontekstiikkunaa vähemmällä muistivaatimuksilla, tämä ominaisuus on huomattavasti enemmän.
Jamba on ainutlaatuinen arkkitehtuurinsa ansiosta, joka yhdistää tila-avaruusmalleja (SSM), jotka tarjoavat laskentatehokkuutta pitkillä datasarjoilla, ja muuntajia, jotka tunnistetaan monimutkaisista päättelyistään. SSM:t, kuten avoimen lähdekoodin malli Mamba, parantavat mallin tehokkuutta ja suorituskykyä pidemmissä yhteyksissä, mutta muuntajat ovat erinomaisia määrittämään saapuvan tiedon relevanssi. Tämä tekee Jambasta kolme kertaa tehokkaamman kuin samankokoiset muuntajamallit.
Jamba on uraauurtava esimerkki SSM:n käytöstä suurissa kaupallisissa malleissa, mikä lupaa parempaa suorituskykyä ja tehokkuutta. Se asetettiin tutkijoiden saataville avoimen lähdekoodin lisenssillä tarkoituksena lisätä turvatoimia ja parannuksia myöhemmissä julkaisuissa. Jamballa on Daganin mukaan kyky muuttaa mallien suorituskykyä täysin yksittäisissä GPU:issa, mikä olisi merkittävä läpimurto tekoälyn tehokkuudessa ja suunnittelussa.
Varmista tulevaisuutesi tekoälyssä ja big datassa Code Labs Academy:n käytännön Data Science and AI Bootcamp avulla.