Փոքր AI մոդելների մեծ առավելությունները տեխնոլոգիական հսկաների համար

Փոքր AI մոդելների մեծ առավելությունները տեխնոլոգիական հսկաների համար

Մարդկային ինտելեկտի կրկնօրինակման հետամուտ լինելով, արհեստական ​​ինտելեկտի սպառազինությունների մրցավազքի հիմնական ուշադրությունը սկզբնապես կենտրոնացած էր տվյալների լայնածավալ հավաքածուների վրա պատրաստված զանգվածային մոդելների ստեղծման շուրջ: Այնուամենայնիվ, վերջին ժամանակներում նկատելի տեղաշարժ է տեղի ունեցել, երբ տեխնոլոգիական հսկաներն ու ստարտափներն ավելի ու ավելի են ուղղում իրենց ուշադրությունը դեպի ավելի պարզեցված և մասնագիտացված AI ծրագրակազմ, որն ավելի էժան և արագ է:

Այս փոքր և միջին չափի լեզվական մոդելները, որոնք հատկապես նախագծված են հատուկ առաջադրանքների համար և պատրաստված են ավելի քիչ տվյալների հետ, ձեռք են բերել զգալի ժողովրդականություն: Ի տարբերություն իրենց ավելի մեծ գործընկերների, դրանք կարող են մշակվել 10 միլիոն դոլարից ցածր գնով և օգտագործել 10 միլիարդից պակաս պարամետր: Համեմատության համար նշենք, որ OpenAI-ի GPT-4o, ամենամեծ մոդելներից մեկը, ավելի քան 100 միլիոն դոլար է պահանջվել ավելի քան մեկ տրիլիոն պարամետր կառուցելու և օգտագործելու համար: Այս մոդելների ավելի փոքր չափերը նշանակում են ավելի ցածր հաշվողական էներգիայի պահանջներ և նվազեցված գներ մեկ հարցման համար:

Օրինակ, Microsoft-ը շեշտը դրել է իր փոքր մոդելների Phi ընտանիքի վրա: Microsoft-ի գործադիր տնօրեն Սատյա Նադելան պնդում է, որ այս մոդելները OpenAI-ի ChatGPT-ի ետևում գտնվող մոդելի 1/100-րդն են, սակայն նրանք կարող են կատարել շատ առաջադրանքներ՝ համեմատելի արդյունավետությամբ: Մայքրոսոֆթի գլխավոր կոմերցիոն տնօրեն Յուսուֆ Մեհդին ամրապնդում է տարբեր առաջադրանքների համար տարբեր մոդելների անհրաժեշտությունը՝ նշելով մեծ մոդելների գործարկման հետ կապված սպասվածից բարձր ծախսերը: Ավելին, [Microsoft]-ը (https://www.microsoft.com/en-us/surface/business/surface-laptop-7th-edition) վերջերս ներկայացրել է AI դյուրակիր համակարգիչներ, որոնք օգտագործում են բազմաթիվ AI մոդելներ որոնման և պատկերների ստեղծման համար: Այս մոդելները գործում են հենց սարքի վրա՝ առանց հենվելու ընդարձակ ամպի վրա հիմնված սուպերհամակարգիչների վրա, ինչպես դա տեղի է ունենում ChatGPT-ի դեպքում:

Այլ կորպորացիաներ, ինչպիսիք են Google-ը և AI ստարտափները, ինչպիսիք են Mistral-ը, Anthropic-ը և Cohere-ը, նույնպես թողարկել են ավելի փոքր մոդելներ: Բացի այդ, Apple-ը ներկայացրել է փոքր մոդելներ ինտեգրելու պլաններ՝ հեռախոսների վրա AI գործառնությունների արագությունն ու անվտանգությունը բարձրացնելու համար:

OpenAI-ը, որը հայտնի է խոշոր մոդելների քարոզչությամբ, գործարկել է իր առաջատար մոդելի ավելի մատչելի տարբերակը և մտադիր է ապագայում կենտրոնանալ փոքր մոդելների մշակման վրա: Խոշոր մոդելները չափազանցված են այնպիսի առաջադրանքների համար, ինչպիսիք են փաստաթղթերի ամփոփումը կամ պատկերների ստեղծումը, ինչը նման է տանկի օգտագործմանը պարզ մթերային գնումների համար: Մյուս կողմից, ավելի փոքր մոդելները կարող են համեմատելի արդյունավետություն առաջարկել զգալիորեն ցածր գնով: Այս մոդելները հաճախ հարմարեցված են հատուկ խնդիրների համար, ինչպիսիք են իրավական փաստաթղթերի կառավարումը կամ ներքին հաղորդակցությունը: AI21 Labs-ից Յոավ Շոհամը պնդում է, որ փոքր մոդելները տնտեսապես ավելի մատչելի են լայնածավալ օգտագործման համար՝ արժենալով մեծ մոդելների միայն մի մասնիկը, մինչդեռ հարցերին պատասխաններ են տալիս:

Բիզնեսները պատրաստակամորեն ընդունում են այս փոքր մոդելները՝ բարձրացնելու արդյունավետությունը և նվազեցնելու ծախսերը: Օրինակ, Experian-ն անցավ ավելի փոքր մոդելների իրենց AI չաթ-բոտերի համար և հասավ ավելի մեծ մոդելների նման կատարողականի, բայց նվազեցված ծախսերով: Salesforce-ի Clara Shih-ն ընդգծում է փոքր մոդելների գործնականությունը, քանի որ մոդելները հաճախ հանգեցնում են ավելորդ ծախսերի և հետաձգման խնդիրների:

OpenAI-ի կողմից GPT-4-ի թողարկումից ի վեր, խոշոր մոդելների մշակման մեջ էական առաջընթաց չի գրանցվել, ինչը հանգեցրել է առաջընթացի լճացման: Հետևաբար, ջանքերն ուղղվել են ավելի փոքր մոդելների արդյունավետության բարձրացմանը: Սեբաստիեն Բուբեկը Microsoft-ից նկատում է զարգացման ընթացիկ դադարը և խրախուսում է արդյունավետությունը բարձրացնելու ջանքերը:

Չնայած այս տեղաշարժին, մեծ մոդելները դեռ արժեքավոր են առաջադեմ առաջադրանքների համար: Ընկերությունները, ինչպիսիք են [Apple]-ը (https://codelabsacademy.com/news/ai-at-your-fingertips-chatgpt-app-now-available-for-mac-2024-07-02) և Microsoft-ը շարունակում են ներառել այնպիսի խոշոր մոդելներ, ինչպիսիք են. որպես ChatGPT իրենց արտադրանքներում, թեև այս ինտեգրումները սովորաբար ներկայացնում են իրենց ընդհանուր AI նախաձեռնությունների միայն մի մասը: Այս առաջընթացը նշանակում է արհեստական ​​ինտելեկտի փոխակերպումը ֆուտուրիստական ​​ցուցադրություններից գործնական գովազդի:

Code Labs Academy © 2025 Բոլոր իրավունքները պաշտպանված են.