Cenšoties replicēt cilvēka intelektu, mākslīgā intelekta bruņošanās sacensību galvenā uzmanība sākotnēji bija vērsta uz masīvu modeļu izveidi, kas apmācīti plašās datu kopās. Tomēr pēdējā laikā ir notikušas ievērojamas pārmaiņas, tehnoloģiju giganti un jaunuzņēmumi arvien vairāk pievērš uzmanību racionalizētākai un specializētākai mākslīgā intelekta programmatūrai, kas ir lētāka un ātrāka.
Šie mazākie un vidējie valodu modeļi, kas īpaši izstrādāti konkrētiem uzdevumiem un apmācīti ar mazāku datu apjomu, ir guvuši ievērojamu popularitāti. Atšķirībā no lielākajiem kolēģiem, tos var izstrādāt par izmaksām, kas nepārsniedz 10 miljonus USD, un izmantot mazāk nekā 10 miljardus parametru. Salīdzinājumam, OpenAI's GPT-4o, kas ir viens no lielākajiem modeļiem, konstruēšanai prasīja vairāk nekā 100 miljonus ASV dolāru un izmantoja vairāk nekā vienu triljonu parametru. Šo modeļu mazākais izmērs nozīmē zemākas skaitļošanas jaudas prasības un zemākas cenas par vaicājumu.
Piemēram, Microsoft ir licis uzsvaru uz savu mazo modeļu Phi saimi. Satja Nadella, Microsoft izpilddirektors, apgalvo, ka šie modeļi ir 1/100 daļa no modeļa, kas ir aiz OpenAI ChatGPT, taču tie var tikt galā ar daudziem uzdevumiem ar salīdzināmu efektivitāti. Jusufs Mehdi, Microsoft galvenais komercdirektors, pastiprina vajadzību pēc atšķirīgiem modeļiem dažādiem uzdevumiem, norādot uz augstākām, nekā gaidīts, izmaksām, kas saistītas ar lielu modeļu darbināšanu. Turklāt Microsoft nesen ir ieviesusi AI klēpjdatorus, kuros meklēšanai un attēlu ģenerēšanai tiek izmantoti daudzi AI modeļi. Šie modeļi darbojas pašā ierīcē, nepaļaujoties uz plašiem mākoņa bāzes superdatoriem, kā tas ir ChatGPT gadījumā.
Citas korporācijas, piemēram, Google un AI jaundibinājumi, piemēram, Mistral, Anthropic un Cohere, arī ir izlaiduši mazākus modeļus. Turklāt Apple ir atklājis plānus integrēt mazus modeļus, lai uzlabotu AI darbību ātrumu un drošību tālruņos.
OpenAI, kas ir slavena ar lielu modeļu aizstāvību, ir laidusi klajā sava vadošā modeļa versiju par pieejamāku cenu un plāno nākotnē koncentrēties uz mazāku modeļu izstrādi. Lieli modeļi izrādās pārmērīgi tādiem uzdevumiem kā dokumentu apkopošana vai attēlu ģenerēšana, līdzīgi kā tvertnes izmantošana vienkāršam pārtikas preču iepirkšanās braucienam. Savukārt mazāki modeļi var piedāvāt salīdzināmu veiktspēju par ievērojami zemākām izmaksām. Šie modeļi bieži ir pielāgoti konkrētiem uzdevumiem, piemēram, juridisko dokumentu vai iekšējās komunikācijas pārvaldībai. Yoav Shoham no AI21 Labs apgalvo, ka mazie modeļi ir ekonomiski izdevīgāki plašai lietošanai, maksājot tikai daļu no tā, ko radītu lielie modeļi, vienlaikus sniedzot atbildes uz jautājumiem.
Uzņēmumi viegli pieņem šos mazākos modeļus, lai uzlabotu efektivitāti un samazinātu izmaksas. Piemēram, Experian pārgāja uz mazākiem AI tērzēšanas robotu modeļiem un sasniedza līdzīgu veiktspēju kā lielākiem modeļiem, taču ar mazākiem izdevumiem. Salesforce Clara Shih izceļ mazāku modeļu praktiskumu, jo modeļi bieži rada pārmērīgus izdevumus un latentuma problēmas.
Kopš OpenAI izdeva GPT-4, lielu modeļu izstrādē nav notikuši būtiski sasniegumi, kā rezultātā progress ir apstājies. Līdz ar to centieni ir novirzīti uz mazāku modeļu efektivitātes uzlabošanu. Sebastjens Bubeks (Sébastien Bubeck) no Microsoft novēro pašreizējo lielas izstrādes pauzi un mudina censties uzlabot efektivitāti.
Neskatoties uz šo maiņu, lielie modeļi joprojām ir vērtīgi uzlabotiem uzdevumiem. Tādi uzņēmumi kā Apple un Microsoft turpina iekļaut lielus modeļus, piemēram, kā ChatGPT savos produktos, lai gan šīs integrācijas parasti veido tikai daļu no viņu vispārējām AI iniciatīvām. Šī attīstība nozīmē AI pārveidi no futūristiskām demonstrācijām uz praktiskām reklāmām.