Адамдын интеллектинин кайталанышына умтулуу менен, жасалма интеллект жарыша куралдануу багыты алгач кеңири маалымат топтомдорунда үйрөтүлгөн массалык моделдерди түзүүгө багытталган. Бирок, акыркы убактарда көрүнүктүү жылыштар болду, технология гиганттары жана стартаптар өздөрүнүн көңүлүн арзаныраак жана ылдамыраак AI программалык камсыздоосуна көбүрөөк буруп жатышат.
Бул чакан жана орто тил моделдери, өзгөчө конкреттүү тапшырмалар үчүн иштелип чыккан жана азыраак маалымат менен үйрөтүлгөн, олуттуу популярдуулукка ээ болду. Алардын чоңураак кесиптештеринен айырмаланып, алар 10 миллион доллардан аз чыгым үчүн иштелип чыгып, 10 миллиарддан азыраак параметрлерди колдонсо болот. Салыштыруу үчүн, OpenAI's GPT-4o, эң чоң моделдердин бири, бир триллиондон ашык параметрлерди куруу үчүн 100 миллион доллардан ашык талап кылынган жана колдонулган. Бул моделдердин кичирээк өлчөмү эсептөө кубаттуулугунун талаптарын төмөндөтөт жана бир суроо үчүн бааларды төмөндөтөт.
Мисалы, Microsoft өзүнүн Phi үй-бүлөсүнүн кичинекей моделдерине басым жасады. Майкрософттун башкы директору Сатя Наделла бул моделдер OpenAI's ChatGPT артындагы моделдин 1/100 бөлүгүн түзөт деп ырастайт, бирок алар салыштырмалуу натыйжалуулук менен көптөгөн тапшырмаларды аткара алышат. Microsoft корпорациясынын башкы коммерциялык директору Юсуф Мехди чоң моделдерди иштетүүгө байланыштуу күтүлгөндөн да жогору чыгымдарды айтып, ар кандай тапшырмалар үчүн өзүнчө моделдердин зарылдыгын бекемдейт. Андан тышкары, Microsoft жакында издөө жана сүрөт түзүү үчүн көптөгөн AI моделдерин колдонгон AI ноутбуктарын сунуштады. Бул моделдер ChatGPT сыяктуу булуттагы суперкомпьютерлерге таянбастан аппараттын өзүндө иштешет.
Mistral, Anthropic жана Cohere сыяктуу Google жана AI стартаптары сыяктуу башка корпорациялар дагы кичинекей моделдерин чыгарышты. Кошумчалай кетсек, Apple телефондордогу AI операцияларынын ылдамдыгын жана коопсуздугун жогорулатуу үчүн чакан моделдерди интеграциялоо пландарын жарыялады.
Чоң моделдерди жактоо менен белгилүү болгон OpenAI өзүнүн флагмандык моделинин арзаныраак версиясын ишке киргизди жана келечекте кичинекей моделдерди иштеп чыгууга көңүл бурууну көздөөдө. Чоң моделдер жөнөкөй азык-түлүк сатып алуу сапарында резервуарды колдонууга окшош документти жалпылоо же сүрөт түзүү сыяктуу тапшырмалар үчүн ашыкча болуп саналат. Кичинекей моделдер, экинчи жагынан, бир кыйла төмөн баада салыштырмалуу аткарууну сунуш кыла алат. Бул моделдер көбүнчө юридикалык документтерди же ички байланыштарды башкаруу сыяктуу конкреттүү тапшырмалар үчүн ылайыкташтырылган. AI21 Labs компаниясынын кызматкери Йоав Шохам чакан моделдер кеңири жайылган колдонуу үчүн экономикалык жактан алда канча максатка ылайыктуу деп ырастайт, алар суроолорго жооп берип жатып, чоң моделдер алып келе турган наркынын бир аз гана бөлүгүн түзөт.
Ишкерлер натыйжалуулукту жогорулатуу жана чыгымдарды азайтуу үчүн бул кичинекей моделдерди дароо эле кабыл алып жатышат. Мисалы, Experian AI чатботтору үчүн кичирээк моделдерге өтүп, чоңураак моделдерге окшош көрсөткүчтөргө жетишти, бирок азыраак чыгым менен. Salesforce's Clara Shih кичинекей моделдердин практикалуулугун баса белгилейт, анткени моделдер көбүнчө ашыкча чыгымдарга жана күтүү маселелерине алып келет.
OpenAI тарабынан GPT-4 чыгарылгандан бери чоң моделди иштеп чыгууда олуттуу жылыштар болгон жок, натыйжада прогресстин токтоп калышына алып келди. Демек, аракеттер кичинекей моделдердин натыйжалуулугун жогорулатууга багытталды. Майкрософттун өкүлү Себастьян Бубек чоң өнүгүүдөгү учурдагы тыныгууну байкап, эффективдүүлүктү жогорулатуу аракеттерин кубаттайт.
Бул өзгөрүүгө карабастан, чоң моделдер дагы эле алдыңкы тапшырмалар үчүн баалуулукка ээ. Apple жана Microsoft сыяктуу компаниялар ушуга окшогон чоң моделдерди киргизүүнү улантууда. ChatGPT катары өз өнүмдөрүндө, бирок бул интеграциялар, адатта, алардын жалпы AI демилгелеринин бир бөлүгүн гана түзөт. Бул прогресс AI футуристтик демонстрациялардан практикалык жарнамаларга айлануусун билдирет.