Η Καινοτόμος Προσέγγιση της Τζάμπα στη Γενετική ΤΝ από την AI21 Labs

Ενημερώθηκε για το November 19, 2024 2 λεπτά ανάγνωση

Το Jamba, ένα νέο μοντέλο τεχνητής νοημοσύνης που δημιουργήθηκε από την AI21 Labs, ξεπερνά τους τυπικούς περιορισμούς περιβάλλοντος που έχουν τα μοντέλα παραγωγής τεχνητής νοημοσύνης, ενώ απαιτούν λιγότερη επεξεργαστική ισχύ. Ο κλάδος κινείται προς μοντέλα με σημαντικές δυνατότητες επεξεργασίας περιβάλλοντος, τα οποία βελτιώνουν τη συνοχή σε μεγαλύτερες συζητήσεις, αλλά συχνά έρχονται σε βάρος των υψηλότερων απαιτήσεων επεξεργασίας. Ή Dagan, ο επικεφαλής προϊόντων στα εργαστήρια AI21, ισχυρίζεται ότι μια πιο αποτελεσματική στρατηγική είναι εφικτή και το δείχνει με το πιο πρόσφατο μοντέλο τους, το Jamba.

Τα παράθυρα περιβάλλοντος των μοντέλων τεχνητής νοημοσύνης είναι απαραίτητα για τη διατήρηση της ροής του διαλόγου και της ανάλυσης δεδομένων. Τα μεγαλύτερα παράθυρα είναι καλύτερα στο να καταγράφουν και να διατηρούν τη ροή της συνομιλίας, ενώ τα μικρότερα κάνουν γρήγορα να ξεχνάμε τις πρόσφατες αλληλεπιδράσεις. Το Jamba της AI21 Labs είναι ένα μοντέλο δημιουργίας και ανάλυσης κειμένου αιχμής που μπορεί να χειριστεί μεγάλες ποσότητες δεδομένων και να καλύψει πολλές γλώσσες, συναγωνίζοντας τη δύναμη γνωστών μοντέλων όπως το Gemini της Google και το ChatGPT του OpenAI.

Ένα αξιοσημείωτο χαρακτηριστικό του Jamba είναι η ικανότητά του να διαχειρίζεται έως και 140.000 μάρκες σε μια ενιαία GPU υψηλής τεχνολογίας - περίπου ισοδύναμο με ένα μυθιστόρημα 210 σελίδων. Σε σύγκριση με το Llama 2 της Meta, το οποίο διαχειρίζεται ένα μικρότερο παράθυρο περιβάλλοντος με λιγότερες απαιτήσεις μνήμης, αυτή η δυνατότητα είναι σημαντικά μεγαλύτερη.

Το Jamba είναι μοναδικό λόγω της αρχιτεκτονικής του, η οποία συνδυάζει μοντέλα χώρου κατάστασης (SSM), τα οποία παρέχουν υπολογιστική απόδοση με μεγάλες ακολουθίες δεδομένων, με μετασχηματιστές που αναγνωρίζονται για την περίπλοκη λογική τους. Ενώ τα SSM, όπως το μοντέλο ανοιχτού κώδικα Mamba, βελτιώνουν την αποτελεσματικότητα και την απόδοση του μοντέλου σε μεγαλύτερα περιβάλλοντα, οι μετασχηματιστές είναι εξαιρετικοί στον προσδιορισμό της συνάφειας των εισερχόμενων δεδομένων. Αυτό κάνει το Jamba τρεις φορές πιο αποδοτικό από τα μοντέλα μετασχηματιστών παρόμοιου μεγέθους.

Το Jamba είναι ένα πρωτοποριακό παράδειγμα χρήσης του SSM σε μεγάλης κλίμακας, εμπορικά μοντέλα που υπόσχεται βελτιωμένη απόδοση και αποδοτικότητα. Διατέθηκε στους ερευνητές με άδεια ανοιχτού κώδικα με σκοπό την προσθήκη μέτρων ασφαλείας και βελτιώσεων σε μεταγενέστερες εκδόσεις. Το Jamba, σύμφωνα με τον Dagan, έχει τη δυνατότητα να μεταμορφώσει πλήρως την απόδοση του μοντέλου σε μεμονωμένες GPU, κάτι που θα ήταν μια σημαντική ανακάλυψη στην αποτελεσματικότητα και το σχεδιασμό της τεχνητής νοημοσύνης.

Ασφαλίστε το μέλλον σας στην τεχνητή νοημοσύνη και τα μεγάλα δεδομένα με τα πρακτικά Code Labs Academy του Code Labs Academy Data Science and AI Bootcamp.