Giza adimena errepikatzeko asmoz, hasiera batean adimen artifizialaren arma-lasterketaren ardatza datu multzo zabaletan trebatutako eredu masiboen sorreran zentratu zen. Hala ere, azken boladan aldaketa nabarmena izan da, teknologia erraldoiek eta startup-ek gero eta arreta gehiago bideratzen baitute AI software errazagoa eta espezializatuagoetara, merkeagoa eta azkarragoa dena.
Hizkuntz eredu txiki eta ertain hauek, bereziki zeregin zehatzetarako diseinatuak eta datu gutxiagorekin trebatuak, ospe handia lortu dute. Beraien kontrako handiagoak ez bezala, 10 milioi dolar baino gutxiagoko kostuarekin garatu daitezke eta 10.000 milioi parametro baino gutxiago erabil daitezke. Konparazio baterako, OpenAI-ren GPT-4o, modelo handienetako batek, 100 milioi dolar baino gehiago behar izan zituen bilioi bat parametro baino gehiago eraikitzeko eta erabiltzeko. Eredu hauen tamaina txikiagoak potentzia konputazionalaren eskakizun txikiagoak eta kontsulta bakoitzeko prezioak murrizten ditu.
Adibidez, Microsoft-ek bere Phi modelo txikien familian jarri du garrantzia. Satya Nadella, Microsoft-eko zuzendari nagusiak, eredu hauek OpenAI-ren ChatGPT-ren atzean dagoen ereduaren tamainaren 1/100ekoa direla dio, baina zeregin asko kudeatu ditzakete eraginkortasun parekoarekin. Yusuf Mehdi-k, Microsoft-eko zuzendari komertzial nagusiak, zeregin desberdinetarako eredu desberdinen beharra indartzen du, eredu handiak martxan jartzearekin loturiko kostu handiagoak aipatuz. Gainera, Microsoft berriki AI ordenagailu eramangarriak aurkeztu ditu bilaketa eta irudiak sortzeko AI eredu ugari erabiltzen dituztenak. Eredu hauek gailuan bertan funtzionatzen dute hodeian oinarritutako superordenagailu zabaletan fidatu gabe, ChatGPT-ekin gertatzen den bezala.
Beste korporazio batzuek, hala nola Google eta AI startupek, Mistral, Anthropic eta Cohere bezalakoak ere modelo txikiagoak kaleratu dituzte. Gainera, Apple-k modelo txikiak integratzeko planak aurkeztu ditu telefonoetan AI eragiketen abiadura eta segurtasuna hobetzeko.
OpenAIk, eredu handiak defendatzeagatik ezaguna, bere eredu enblematikoaren bertsio merkeago bat jarri du martxan eta etorkizunean eredu txikiagoak garatzen bideratu nahi du. Eredu handiak gehiegizkoak dira dokumentuen laburpena edo irudiak sortzea bezalako zereginetarako, erosketa-bidaia soil baterako depositua erabiltzearen antzera. Eredu txikiagoek, berriz, errendimendu konparagarria eskain dezakete kostu nabarmen txikiagoarekin. Eredu hauek zeregin zehatzetarako moldatzen dira sarritan dokumentu juridikoak edo barne komunikazioak kudeatzea, esaterako. AI21 Labs-eko Yoav Shoham-ek dio eredu txikiak ekonomikoki bideragarriagoak direla erabilera hedatua izateko, eredu handiek suposatuko luketenaren zati bat baino ez dutela kostatzen galderei erantzunak ematen dituzten bitartean.
Enpresak erraz hartzen ari dira eredu txikiago hauek eraginkortasuna hobetzeko eta kostuak murrizteko. Esaterako, Experian-ek modelo txikiagoetara pasa zen bere AI chatbotetarako eta modelo handienen antzeko errendimendua lortu zuen, baina gastu murriztuarekin. Salesforceren Clara Shih-ek modelo txikiagoen praktikotasuna nabarmentzen du, ereduek askotan gehiegizko gastuak eta latentzia arazoak eragiten baitituzte.
OpenAI-k GPT-4 kaleratu zuenetik, eredu handien garapenean ez da aurrerapen handirik egon, eta ondorioz, aurrerapenaren geldialdia izan da. Ondorioz, eredu txikiagoen eraginkortasuna hobetzera bideratu dira ahaleginak. Microsoft-eko Sébastien Bubeck-ek garapen handian uneko eten bat ikusten du eta eraginkortasuna hobetzeko ahaleginak bultzatzen ditu.
Aldaketa hau izan arren, eredu handiek zeregin aurreratuetarako balio dute oraindik. Apple eta Microsoft bezalako enpresek, hala nola, eredu handiak sartzen jarraitzen dute. ChatGPT gisa beren produktuetan, nahiz eta integrazio horiek normalean beren AI ekimen orokorren zati bat baino ez adierazten duten. Progresio honek AIaren eraldaketa adierazten du erakustaldi futuristetatik iragarki praktikoetara.