Ի՞նչ է Մետա Լլաման: Համապարփակ հայացք ծրագրավորողների համար բաց AI մոդելին

Թարմացվել է September 27, 2024 5 Րոպեներ կարդացեք

17 սեպտեմբերի, 2024 թ

Meta-ն, ինչպես շատ այլ առաջատար տեխնոլոգիական ընկերություններ, մշակել է իր սեփական գեներատիվ AI մոդելը, որը հայտնի է որպես Llama: Այն, ինչ առանձնացնում է Llama-ն, նրա բաց բնույթն է, որը թույլ է տալիս ծրագրավորողներին ներբեռնել և օգտագործել այն զգալի ազատությամբ, չնայած կան որոշ պայմաններ, որոնք պետք է հիշել: Այս մոտեցումը հակադրվում է այնպիսի մոդելների հետ, ինչպիսիք են Anthropic’s Claude-ը, OpenAI’s GPT-4o ([ChatGPT]-ի ետևում գտնվող շարժիչը (/news/ai-at-your-): fingertips-chatgpt-app-now-available-for-mac-2024-07-02)) և Google’s Gemini, որոնք հասանելի են բացառապես API-ների միջոցով:

Մշակողներին ավելի ճկունություն տալու համար Meta-ն համագործակցել է ամպային ծառայություններ մատուցողների հետ, ինչպիսիք են AWS-ը, Google Cloud-ը և Microsoft Azure-ը՝ առաջարկելով Llama-ի ամպային հոսթինգի տարբերակները: Բացի այդ, Meta-ն ստեղծել է գործիքներ, որոնք հեշտացնում են ծրագրավորողների համար մոդելը ճշգրտելու և հարմարեցնելու գործընթացը՝ իրենց հատուկ պահանջներին համապատասխան:

Ստորև ներկայացված է Llama-ի մանրամասն նկարագրությունը, ներառյալ այն, թե ինչ կարող է նա անել, տարբեր տարբերակները, որոնք նա առաջարկում է, և ինչպես կարող եք արդյունավետ օգտագործել այն:

Ի՞նչ է լլաման:

Լլաման միայն մեկ մոդել չէ. այն ներառում է մի շարք մոդելներ, ինչպիսիք են.

Լլամա 8Բ
Լամա 70Բ
Լամա 405Բ

Ամենավերջին տարբերակները (Llama 3.1 8B, Llama 3.1 70B և Llama 3.1 405B) թողարկվել են 2024 թվականի հուլիսին: Այս մոդելները պատրաստված են տվյալների աղբյուրների լայն շրջանակի վրա, ինչպիսիք են տարբեր լեզուներով վեբ էջերը, հանրային ծածկագիրը, առցանց հասանելի ֆայլերը: և այլ արհեստական ինտելեկտի համակարգերի կողմից արտադրված սինթետիկ տվյալներ:

Llama 3.1 8B-ը և 70B-ը կոմպակտ մոդելներ են, որոնք կարող են գործարկել տարբեր սարքեր՝ նոութբուքներից մինչև սերվերներ: Մյուս կողմից, Llama 3.1 405B-ը լայնածավալ մոդել է, որը սովորաբար պահանջում է տվյալների կենտրոնի սարքավորում: Թեև փոքր մոդելները կարող են այնքան հզոր չլինել, որքան 405B-ն, նրանք առաջարկում են ավելի արագ կատարում և օպտիմիզացված են կրճատված պահեստավորման և ուշացման համար:

Llama-ի բոլոր մոդելներն ունեն 128,000 նշաններից բաղկացած համատեքստային պատուհան, որը թույլ է տալիս կարգավորել մոտ 100,000 բառ (կամ 300 էջ տեքստ): Սա մոտավորապես այնքան է գրքերի երկարությունը, ինչպիսիք են «Wuthering Heights»-ը կամ «Harry Potter and the Prisoner of Azkaban»-ը: Համատեքստի երկար պատուհանն օգնում է մոդելին պահպանել տեղեկատվությունը վերջին փաստաթղթերից և տվյալներից՝ նվազեցնելով թեմայից դուրս շեղվելու վտանգը:

Ի՞նչ կարող է անել Լլաման:

Ինչպես մյուս գեներատիվ AI մոդելները, Llama-ն կարող է օգնել մի շարք առաջադրանքներում, ինչպիսիք են կոդավորումը, պատասխանել մաթեմատիկական պարզ հարցերի և փաստաթղթերի ամփոփումը ութ լեզուներով՝ անգլերեն, գերմաներեն, ֆրանսերեն, իտալերեն, պորտուգալերեն, հինդի, իսպաներեն և թայերեն: Այն կարող է կարգավորել տեքստի վրա հիմնված առաջադրանքների մեծ մասը, ինչպես օրինակ՝ PDF-ների և աղյուսակների պես ֆայլերի վերլուծությունը, բայց ներկայումս չունի պատկերներ ստեղծելու կամ մշակելու հնարավորություն՝ մի բան, որը կարող է փոխվել ապագայում:

Llama մոդելները կարող են ինտեգրվել երրորդ կողմի հավելվածների, գործիքների և API-ների հետ՝ տարբեր առաջադրանքներ կատարելու համար: Դրանք կազմաձևված են, որպեսզի օգտագործեն Brave Search՝ ընթացիկ իրադարձությունների վերաբերյալ հարցերին պատասխանելու համար, Wolfram Alpha API-ը՝ մաթեմատիկական և գիտական հարցումների համար, և Python թարգմանիչը՝ կոդի վավերացման համար: Ըստ Meta-ի, Llama 3.1-ը կարող է նույնիսկ օգտագործել որոշ գործիքներ, որոնց վրա հստակորեն չի վերապատրաստվել, թեև այս հատկանիշի հուսալիությունը դեռևս անորոշ է:

Որտե՞ղ կարող եք օգտագործել Լամա:

Եթե ցանկանում եք ուղղակիորեն կապվել Llama-ի հետ, Meta AI chatbot-ի փորձն աջակցվում է այնպիսի հարթակներում, ինչպիսիք են Facebook Messenger-ը, WhatsApp-ը, Instagram-ը, Oculus-ը և Meta.ai-ն:

Մշակողների համար Llama-ն հասանելի է ներբեռնման համար և կարող է մասշտաբավորվել մի քանի հայտնի ամպային հարթակներում: Meta-ն համագործակցել է ավելի քան 25 ընկերությունների հետ՝ Llama-ին հյուրընկալելու համար, այդ թվում՝ Nvidia-ն, Databricks-ը, Groq-ը, Dell-ը և Snowflake-ը: Այս գործընկերներից շատերը տրամադրում են լրացուցիչ գործիքներ, որոնք թույլ են տալիս Llama-ին մուտք գործել սեփական տվյալների կամ ավելի արդյունավետ աշխատել:

Meta-ն առաջարկում է օգտագործել ավելի փոքր Llama մոդելները, մասնավորապես 8B և 70B, ընդհանուր նպատակների համար, ինչպիսիք են չաթ-բոտերի գործարկումը կամ կոդ ստեղծելը: Մյուս կողմից, ավելի մեծ Llama 405B-ն ավելի հարմար է այնպիսի առաջադրանքների համար, ինչպիսին է մոդելային թորումը, որը ներառում է գիտելիքների փոխանցում ավելի մեծ մոդելից փոքր մոդելի, ինչպես նաև սինթետիկ տվյալների ստեղծում՝ այլ մոդելներ պատրաստելու համար:

Ամսական ավելի քան 700 միլիոն օգտատեր ունեցող հավելվածներ գործող ծրագրավորողները պետք է Meta-ից հատուկ լիցենզիա ստանան Llama մուտք գործելու համար, և դա կտրվի Meta-ի հայեցողությամբ:

Ի՞նչ գործիքներ է առաջարկում Meta-ն Լամայի համար:

Meta-ն ներկայացրել է մի քանի գործիքներ Լամայի անվտանգությունը բարելավելու համար.

Llama Guard. Չափավորող շրջանակ, որը բացահայտում է այնպիսի խնդրահարույց բովանդակություն, ինչպիսիք են ատելության խոսքը, ինքնավնասումը և հեղինակային իրավունքի խախտումը:
Prompt Guard. Գործիք, որը հատուկ նախագծված է պաշտպանելու Լամային վնասակար հաղորդագրություններից, որոնք փորձում են շրջանցել նրա անվտանգության միջոցները:
CyberSecEval: Կիբերանվտանգության ռիսկերի գնահատման հավաքածու, որը գնահատում է մոդելի անվտանգությունը՝ կենտրոնանալով այնպիսի սպառնալիքների վրա, ինչպիսիք են ավտոմատացված սոցիալական ճարտարագիտությունը և վիրավորական կիբեր գործունեությունը:

Օրինակ, Llama Guard-ը կարող է հայտնաբերել վնասակար կամ անօրինական բովանդակություն, որը մուտքագրվել կամ ստեղծվել է Llama-ում, ինչը թույլ է տալիս մշակողներին հարմարեցնել, թե որ կատեգորիաներն են արգելափակված: Prompt Guard-ը կենտրոնանում է «հաղորդագրությունների ներարկման հարձակումներից» պաշտպանվելու վրա, որոնք փորձում են շահարկել մոդելը: CyberSecEval-ն առաջարկում է հենանիշեր Llama մոդելների հետ կապված անվտանգության ռիսկերը գնահատելու համար:

Լամայի սահմանափակումները

Llama-ն, ինչպես և այլ գեներատիվ AI մոդելները, ունի իր սահմանափակումներն ու հնարավոր ռիսկերը: Հիմնական մտահոգություններից մեկն այն է, թե արդյոք Մետան օգտագործել է հեղինակային իրավունքով պաշտպանված նյութեր Լամային մարզելու համար: Եթե դա այդպես է, օգտվողները կարող են պատասխանատվություն կրել մոդելի կողմից ստեղծված հեղինակային իրավունքով պաշտպանված ցանկացած բովանդակության համար:

Վերջին զեկույցները ցույց են տալիս, որ Meta-ն օգտագործում է հեղինակային իրավունքով պաշտպանված էլեկտրոնային գրքեր AI ուսուցման համար, չնայած նրան, որ ստացել է իրավական նախազգուշացումներ: Ընկերությունը նաև ներառում է բովանդակություն Instagram-ից և Facebook-ից իր մոդելների ուսուցման մեջ՝ դժվարացնելով օգտատերերի համար հրաժարվելը: Meta-ն բախվում է բազմաթիվ հայցերի, այդ թվում հեղինակների, ինչպիսիք են Սառա Սիլվերմանը, ովքեր պնդում են, որ ընկերությունն օգտագործել է հեղինակային իրավունքով պաշտպանված նյութեր առանց թույլտվության:

Կարևոր նկատառում է ծրագրավորումը, քանի որ Llama-ն կարող է ստեղծել խելագարված կամ անապահով կոդ: Չափազանց կարևոր է, որ մշակողները ունենան մարդկային փորձագետի կողմից AI-ի կողմից ստեղծված ցանկացած ծածկագիր՝ նախքան այն կիրառելը իրենց հավելվածներում:

Թեև Meta-ի Llama մոդելն առաջարկում է զգալի ճկունություն և հնարավորություններ մշակողների համար, կարևոր է ճանաչել դրա հետ կապված հնարավոր ռիսկերն ու սահմանափակումները:

–

Ձեզ բերված է Code Labs Academy – Your Leading Online Coding Bootcamp future Tech Innovators.