Meta Llama деген эмне? Иштеп чыгуучулар үчүн ачык AI моделине комплекстүү кароо

Жаңыртылды September 23, 2024 4 Протокол окуу

17-сентябрь, 2024-жыл

Meta, башка көптөгөн алдыңкы технологиялык компаниялар сыяктуу эле, Llama деп аталган өзүнүн генеративдик AI моделин иштеп чыкты. Лламанын өзгөчөлүгү анын ачык мүнөзү, бул иштеп чыгуучуларга аны бир топ эркиндик менен жүктөп алууга жана колдонууга мүмкүндүк берет, бирок кээ бир шарттарды эске алуу керек. Бул ыкма Anthropic’s Claude, OpenAI’s GPT-4o ([ChatGPT] артындагы кыймылдаткыч (/news/ai-at-your-) сыяктуу моделдерден айырмаланат. fingertips-chatgpt-app-now-available-for-mac-2024-07-02)) жана Google’дун Gemini, алар API аркылуу гана жеткиликтүү.

Иштеп чыгуучуларга көбүрөөк ийкемдүүлүк берүү үчүн, Meta AWS, Google Cloud жана Microsoft Azure сыяктуу булуттук кызмат көрсөтүүчүлөр менен өнөктөш болуп, Llamaнын булуттагы версияларын сунуштады. Кошумча, Meta иштеп чыгуучулар үчүн моделди тактоо жана алардын конкреттүү талаптарына ылайыкташтыруу процессин жөнөкөйлөтүүчү куралдарды курган.

Төмөндө Лламанын деталдуу сүрөттөлүшү, анын ичинде ал эмне кыла аларын, ал сунуш кылган ар кандай версияларын жана аны кантип натыйжалуу колдонсоңуз болот.

Лама деген эмне?

Ллама - бул жөн эле үлгү эмес; ал бир катар моделдерди камтыйт, мисалы:

Llama 8B
Llama 70B
Llama 405B

Эң акыркы версиялары (Llama 3.1 8B, Llama 3.1 70B жана Llama 3.1 405B) 2024-жылдын июлунда чыгарылган. Бул моделдер ар кандай тилдердеги веб-баракчалар, коомдук код, онлайн режиминде жеткиликтүү файлдар сыяктуу маалымат булактарынын кеңири спектринде үйрөтүлгөн., жана башка AI системалары тарабынан өндүрүлгөн синтетикалык маалыматтар.

Llama 3.1 8B жана 70B компакт моделдер болуп саналат, алар ноутбуктардан серверлерге чейин ар кандай түзмөктөрдү иштете алат. Llama 3.1 405B, экинчи жагынан, адатта маалымат борборунун жабдыктарын талап кылган масштабдуу модель. Кичинекей моделдер 405B сыяктуу күчтүү болбосо да, алар тезирээк иштөөнү сунуштайт жана сактоону жана күтүү мөөнөтүн азайтуу үчүн оптималдаштырылган.

Бардык Llama моделдеринде 128 000 белгиден турган контексттик терезе бар, бул аларга 100 000 сөздү (же тексттин 300 барагын) иштетүүгө мүмкүндүк берет. Бул болжол менен Уузердик бийиктиктер же Гарри Поттер жана Азкабан туткуну сыяктуу китептердин узундугу. Узун контексттик терезе моделге акыркы документтерден жана маалыматтардан маалыматты сактап калууга жардам берип, темадан четтеп кетүү коркунучун азайтат.

Лама эмне кыла алат?

Башка генеративдик AI моделдери сыяктуу эле, Llama коддоо, жөнөкөй математика суроолоруна жооп берүү жана сегиз тилде документтерди жыйынтыктоо сыяктуу ар кандай тапшырмаларды аткарууга жардам бере алат: англис, немис, француз, италия, португал, хинди, испан жана тай. Ал PDF жана электрондук жадыбал сыяктуу файлдарды талдоо сыяктуу көпчүлүк текстке негизделген тапшырмаларды аткара алат, бирок учурда анын сүрөттөрдү түзүү же иштетүү мүмкүнчүлүгү жок — бул келечекте өзгөрүшү мүмкүн.

Llama моделдери ар кандай тапшырмаларды аткаруу үчүн үчүнчү тараптын колдонмолору, куралдары жана API’лери менен бириге алат. Алар учурдагы окуялар тууралуу суроолорго жооп берүү үчүн Brave Search’ти, математика жана илим сурамдары үчүн Wolfram Alpha API’син жана кодду текшерүү үчүн Python котормочусун колдонууга конфигурацияланган. Метанын айтымында, Llama 3.1 ал тургай, бул өзгөчөлүктүн ишенимдүүлүгү дагы эле белгисиз болсо да, ал ачык окутулбаган кээ бир куралдарды колдоно алат.

Ламаны кайда колдонсо болот?

Эгер сиз Llama менен түз байланышууну кааласаңыз, Meta AI чатбот тажрыйбасы Facebook Messenger, WhatsApp, Instagram, Oculus жана Meta.ai сыяктуу платформаларда колдоого алынат.

Иштеп чыгуучулар үчүн Llama жүктөп алуу үчүн жеткиликтүү жана бир нече популярдуу булут платформаларына масштабдалышы мүмкүн. Meta Nvidia, Databricks, Groq, Dell жана Snowflake сыяктуу ламаларды өткөрүү үчүн 25тен ашык компаниялар менен кызматташкан. Бул өнөктөштөрдүн көбү Llamaга менчик маалыматтарга жетүү же эффективдүү иштөөгө мүмкүндүк берген кошумча куралдар менен камсыз кылат.

Мета чакан Llama моделдерин, атап айтканда 8B жана 70B, чатботторду иштетүү же код түзүү сыяктуу жалпы максаттар үчүн колдонууну сунуштайт. Башка жагынан алганда, чоңураак Llama 405B билимди чоңураак модельден кичирээк моделге өткөрүп берүүнү, ошондой эле башка моделдерди окутуу үчүн синтетикалык маалыматтарды түзүүнү камтыган моделди дистилляциялоо сыяктуу тапшырмалар үчүн ылайыктуу.

Ай сайын 700 миллиондон ашык колдонуучулары бар тиркемелерди иштеткен иштеп чыгуучулар Llamaга кирүү үчүн Metaдан атайын лицензия алышы керек жана бул Метанын кароосу боюнча берилет.

Мета лама үчүн кандай куралдарды сунуштайт?

Мета Лламанын коопсуздугун жакшыртуу үчүн бир нече куралдарды киргизди:

Llama Guard: Жек көрүү сөздөрү, өзүнө зыян келтирүү жана автордук укуктун бузулушу сыяктуу көйгөйлүү мазмунду аныктаган модерациялоо системасы.
Prompt Guard: Ламаны коопсуздук чараларын кыйгап өтүүгө аракет кылган зыяндуу билдирүүлөрдөн коргоо үчүн атайын иштелип чыккан курал.
CyberSecEval: Автоматташтырылган социалдык инженерия жана агрессивдүү кибер аракеттер сыяктуу коркунучтарга көңүл буруп, моделдин коопсуздугун баалаган киберкоопсуздук тобокелдигин баалоо топтому.

Мисалы, Llama Guard Llamaга киргизилген же түзүлгөн зыяндуу же мыйзамсыз мазмунду аныктап, иштеп чыгуучуларга кайсы категориялар бөгөттөлөөрүн ыңгайлаштырууга мүмкүндүк берет. Prompt Guard моделди манипуляциялоого аракет кылган “билдирүүлөрдү киргизүү чабуулдарынан” коргонууга басым жасайт. CyberSecEval Llama моделдери менен байланышкан коопсуздук тобокелдиктерин баалоо үчүн эталондорду сунуш кылат.

Лламанын чектөөлөрү

Llama, башка генеративдик AI моделдери сыяктуу эле, анын чектөөлөрү жана мүмкүн болуучу тобокелдиктери бар. Негизги көйгөйлөрдүн бири Мета ламаны окутуу үчүн автордук укук менен корголгон материалдарды колдонгонбу. Андай болсо, колдонуучулар модель түзгөн автордук укук менен корголгон мазмун үчүн жоопкерчиликке тартылышы мүмкүн.

Акыркы маалыматтарда Мета юридикалык эскертүү алганына карабастан, AI окутуу үчүн автордук укук менен корголгон электрондук китептерди колдонуп жатканын көрсөтүп турат. Компания ошондой эле Instagram жана Facebook мазмунун өзүнүн моделдик тренингине киргизип, колдонуучулардын баш тартуусун кыйындатат. Мета бир нече сот иштерине, анын ичинде Сара Силверман сыяктуу авторлордун бири, компания автордук укук менен корголгон материалдарды уруксатсыз колдонгон деп ырасташат.

Маанилүү маселе программалоо болуп саналат, анткени Llama ката же кооптуу кодду чыгарышы мүмкүн. Иштеп чыгуучулар AI тарабынан түзүлгөн кодду өзүнүн тиркемелерине киргизүүдөн мурун адамдык эксперттин карап чыгышы абдан маанилүү.

Meta’s Llama модели иштеп чыгуучулар үчүн кыйла ийкемдүүлүктү жана мүмкүнчүлүктөрдү сунуш кылганы менен, аны менен келген мүмкүн болуучу тобокелдиктерди жана чектөөлөрдү таануу маанилүү.

–

Сизге Code Labs Academy тарабынан алып келинди – Сиздин алдыңкы Онлайн коддоо Bootcamp Келечектеги Технологиялык Инноваторлор үчүн.