Texniki nəhənglər üçün kiçik AI modellərinin böyük faydaları

Texniki nəhənglər üçün kiçik AI modellərinin böyük faydaları

İnsan intellektini təkrarlamaq üçün süni intellektin silahlanma yarışının diqqəti əvvəlcə geniş verilənlər bazasında öyrədilmiş kütləvi modellərin yaradılması ətrafında cəmləşdi. Bununla belə, son dövrlərdə nəzərəçarpacaq dəyişiklik baş verib, texnoloji nəhənglər və startaplar diqqətlərini getdikcə daha ucuz və daha sürətli olan daha sadələşdirilmiş və ixtisaslaşmış süni intellekt proqramına yönəldirlər.

Xüsusilə xüsusi tapşırıqlar üçün nəzərdə tutulmuş və daha az məlumatla öyrədilmiş bu kiçik və orta ölçülü dil modelləri əhəmiyyətli dərəcədə populyarlıq qazanmışdır. Daha böyük həmkarlarından fərqli olaraq, onlar 10 milyon dollardan aşağı qiymətə hazırlana və 10 milyarddan az parametrdən istifadə edə bilərlər. Müqayisə üçün qeyd edək ki, ən böyük modellərdən biri olan OpenAI-nin GPT-4o bir trilyondan çox parametri qurmaq və istifadə etmək üçün 100 milyon dollardan çox tələb olunur. Bu modellərin daha kiçik ölçüləri hesablama gücü tələblərinin aşağı düşməsinə və hər sorğu üçün aşağı qiymətlərə çevrilir.

Məsələn, Microsoft, Phi ailəsinin kiçik modellərinə diqqət yetirdi. Microsoft-un baş direktoru Satya Nadella iddia edir ki, bu modellər OpenAI-nin ChatGPT-nin arxasındakı modelin ölçüsünün 1/100-üdür, lakin onlar bir çox işi müqayisə edilə bilən səmərəliliklə idarə edə bilirlər. Microsoft-un Baş Kommersiya Direktoru Yusuf Mehdi, böyük modellərin idarə edilməsi ilə bağlı gözləniləndən daha yüksək xərclərə istinad edərək, müxtəlif tapşırıqlar üçün fərqli modellərə ehtiyacı gücləndirir. Bundan əlavə, Microsoft bu yaxınlarda axtarış və təsvir yaratmaq üçün çoxsaylı AI modellərindən istifadə edən AI noutbuklarını təqdim etdi. Bu modellər, ChatGPT-də olduğu kimi, geniş bulud əsaslı superkompüterlərə etibar etmədən cihazın özündə işləyir.

Mistral, Anthropic və Cohere kimi Google və AI startapları kimi digər korporasiyalar da daha kiçik modellər buraxdılar. Bundan əlavə, Apple telefonlarda süni intellekt əməliyyatlarının sürətini və təhlükəsizliyini artırmaq üçün kiçik modelləri inteqrasiya etmək planlarını açıqladı.

Böyük modellərin müdafiəsi ilə tanınan OpenAI, flaqman modelinin daha sərfəli versiyasını təqdim etdi və gələcəkdə daha kiçik modellərin inkişafına diqqət yetirmək niyyətindədir. Böyük modellər, sadə bir ərzaq alış-verişi səfəri üçün tankdan istifadəyə bənzər, sənədlərin ümumiləşdirilməsi və ya təsvirin yaradılması kimi vəzifələr üçün həddən artıq çox olduğunu sübut edir. Digər tərəfdən, kiçik modellər əhəmiyyətli dərəcədə aşağı qiymətə müqayisə edilə bilən performans təklif edə bilər. Bu modellər çox vaxt hüquqi sənədlərin və ya daxili kommunikasiyaların idarə edilməsi kimi xüsusi tapşırıqlar üçün uyğunlaşdırılır. AI21 Labs-dan Yoav Shoham iddia edir ki, kiçik modellər geniş istifadə üçün iqtisadi cəhətdən daha məqsədəuyğundur və suallara cavab verərkən böyük modellərin gətirəcəyi məbləğin yalnız bir hissəsinə başa gəlir.

Bizneslər səmərəliliyi artırmaq və xərcləri azaltmaq üçün bu kiçik modelləri asanlıqla mənimsəyir. Məsələn, Experian süni intellekt chatbotları üçün daha kiçik modellərə keçdi və daha böyük modellərlə eyni performansa nail oldu, lakin daha az xərclə. Salesforce-dan Clara Shih kiçik modellərin praktikliyini vurğulayır, çünki modellər çox vaxt həddindən artıq xərclərə və gecikmə problemlərinə səbəb olur.

OpenAI tərəfindən GPT-4-ün buraxılmasından bəri böyük modellərin işlənib hazırlanmasında heç bir əhəmiyyətli irəliləyiş olmamışdır ki, bu da tərəqqinin durğunluğu ilə nəticələnir. Nəticə etibarilə, səylər daha kiçik modellərin səmərəliliyinin artırılmasına yönəldilmişdir. Microsoft-dan Sebastien Bubek böyük inkişafda cari fasiləni müşahidə edir və səmərəliliyi artırmaq üçün səyləri təşviq edir.

Bu dəyişikliyə baxmayaraq, böyük modellər hələ də qabaqcıl tapşırıqlar üçün dəyər daşıyır. Apple və Microsoft kimi şirkətlər bu kimi böyük modelləri daxil etməyə davam edir. məhsullarında ChatGPT kimi, baxmayaraq ki, bu inteqrasiyalar adətən onların ümumi AI təşəbbüslərinin yalnız bir hissəsini təmsil edir. Bu irəliləyiş süni intellektin futuristik nümayişlərdən praktik reklamlara çevrilməsini ifadə edir.

Code Labs Academy © 2025 Bütün hüquqlar qorunur.