Sa paghahangad ng pagkopya ng katalinuhan ng tao, ang focus ng artificial intelligence arms race sa simula ay nakasentro sa paglikha ng napakalaking modelo na sinanay sa malawak na mga dataset. Gayunpaman, nagkaroon ng kapansin-pansing pagbabago sa mga nagdaang panahon, na ang mga tech na higante at mga startup ay lalong nagdidirekta sa kanilang atensyon patungo sa mas streamlined at espesyal na AI software na mas mura at mas mabilis.
Ang mas maliit at katamtamang laki ng mga modelo ng wika na ito, partikular na idinisenyo para sa mga partikular na gawain at sinanay na may mas kaunting data, ay nakakuha ng makabuluhang katanyagan. Hindi tulad ng kanilang mas malalaking katapat, maaari silang mabuo sa halagang wala pang $10 milyon at gumamit ng mas kaunti sa 10 bilyong mga parameter. Para sa paghahambing, OpenAI's GPT-4o, isa sa pinakamalalaking modelo, ay nangangailangan ng mahigit $100 milyon para makabuo at gumamit ng higit sa isang trilyong parameter. Ang mas maliit na sukat ng mga modelong ito ay isinasalin sa mas mababang computational power na kinakailangan at pinababang presyo sa bawat query.
Halimbawa, binigyang-diin ng Microsoft ang pamilyang Phi nito ng maliliit na modelo. Sinabi ni Satya Nadella, CEO ng Microsoft, na ang mga modelong ito ay 1/100th ang laki ng modelo sa likod ng OpenAI's ChatGPT, ngunit maaari nilang pangasiwaan ang maraming gawain na may maihahambing na kahusayan. Si Yusuf Mehdi, Chief Commercial Officer ng Microsoft, ay nagpapatibay sa pangangailangan para sa mga natatanging modelo para sa iba't ibang gawain, na binabanggit ang mas mataas kaysa sa inaasahang mga gastos na nauugnay sa pagpapatakbo ng malalaking modelo. Higit pa rito, ipinakilala kamakailan ng Microsoft ang mga AI laptop na gumagamit ng maraming modelo ng AI para sa paghahanap at pagbuo ng larawan. Gumagana ang mga modelong ito sa mismong device nang hindi umaasa sa mga malawak na cloud-based na supercomputer, gaya ng kaso sa ChatGPT.
Ang iba pang mga korporasyon tulad ng Google at AI startups tulad ng Mistral, Anthropic, at Cohere ay naglabas din ng mas maliliit na modelo. Bukod pa rito, inihayag ng Apple ang mga plano na pagsamahin ang maliliit na modelo upang mapahusay ang bilis at seguridad ng mga pagpapatakbo ng AI sa mga telepono.
Ang OpenAI, na kilala sa pagtataguyod ng malalaking modelo, ay naglunsad ng mas abot-kayang bersyon ng flagship model nito at naglalayong tumuon sa pagbuo ng mas maliliit na modelo sa hinaharap. Ang malalaking modelo ay nagpapatunay na sobra-sobra para sa mga gawain tulad ng pagbubuod ng dokumento o pagbuo ng larawan, katulad ng paggamit ng tangke para sa isang simpleng grocery shopping trip. Ang mas maliliit na modelo, sa kabilang banda, ay maaaring mag-alok ng maihahambing na pagganap sa isang makabuluhang mas mababang halaga. Ang mga modelong ito ay kadalasang iniangkop para sa mga partikular na gawain tulad ng pamamahala ng mga legal na dokumento o panloob na komunikasyon. Iginiit ni Yoav Shoham ng AI21 Labs na ang mga maliliit na modelo ay mas matipid para sa malawakang paggamit, na nagkakahalaga lamang ng isang maliit na bahagi ng kung ano ang kailangan ng malalaking modelo habang nagbibigay ng mga sagot sa mga tanong.
Ang mga negosyo ay madaling gamitin ang mas maliliit na modelong ito upang mapahusay ang kahusayan at mabawasan ang mga gastos. Halimbawa, lumipat ang Experian sa mas maliliit na modelo para sa kanilang mga AI chatbot at nakamit ang katulad na pagganap sa mas malalaking modelo ngunit sa mas mababang gastos. Itinatampok ng Clara Shih ng Salesforce ang pagiging praktikal ng mas maliliit na modelo, dahil kadalasang humahantong ang mga modelo sa labis na paggasta at mga isyu sa latency.
Mula nang ilabas ang GPT-4 ng OpenAI, walang makabuluhang pagsulong sa malalaking pag-unlad ng modelo, na nagreresulta sa paghinto ng pag-unlad. Dahil dito, ang mga pagsisikap ay na-redirect patungo sa pagpapabuti ng kahusayan ng mas maliliit na modelo. Si Sébastien Bubeck mula sa Microsoft ay nakakita ng kasalukuyang paghinto sa malaking pag-unlad at hinihikayat ang mga pagsisikap na pahusayin ang kahusayan.
Sa kabila ng pagbabagong ito, ang malalaking modelo ay may halaga pa rin para sa mga advanced na gawain. Ang mga kumpanya tulad ng Apple at Microsoft ay patuloy na nagsasama ng malalaking modelo tulad bilang ChatGPT sa kanilang mga produkto, bagama't ang mga pagsasama-samang ito ay karaniwang kumakatawan lamang sa isang maliit na bahagi ng kanilang pangkalahatang mga inisyatiba ng AI. Ang pag-unlad na ito ay nagpapahiwatig ng pagbabago ng AI mula sa mga futuristic na demonstrasyon patungo sa mga praktikal na patalastas.