Што такое мета-лама? Комплексны погляд на мадэль Open AI для распрацоўшчыкаў

Абноўлены на September 24, 2024 5 Прачытаныя хвіліны

17 верасня 2024 г

Meta, як і многія іншыя вядучыя тэхналагічныя кампаніі, распрацавала ўласную генератыўную мадэль штучнага інтэлекту, вядомую як Llama. Што вылучае Llama, так гэта яе адкрыты характар, які дазваляе распрацоўшчыкам спампоўваць і выкарыстоўваць яе са значнай свабодай, хоць ёсць некаторыя ўмовы, пра якія варта памятаць. Такі падыход адрозніваецца ад такіх мадэляў, як Claude ад Anthropic, GPT-4o OpenAI (рухавік ChatGPT), і Google Gemini, якія даступныя выключна праз API.

Каб даць распрацоўшчыкам большую гнуткасць, Meta супрацоўнічае з пастаўшчыкамі воблачных паслуг, такімі як AWS, Google Cloud і Microsoft Azure, каб прапанаваць версіі Llama, размешчаныя ў воблаку. Акрамя таго, Meta стварыла інструменты, якія спрашчаюць распрацоўшчыкам працэс тонкай налады і адаптацыі мадэлі для задавальнення іх канкрэтных патрабаванняў.

Ніжэй прыводзіцца падрабязнае апісанне Llama, у тым ліку тое, што ён можа рабіць, розныя версіі, якія ён прапануе, і як вы можаце выкарыстоўваць яго эфектыўна.

Што такое Лама?

Лама - гэта не проста адна мадэль; ён уключае ў сябе шэраг мадэляў, такіх як:

Лама 8B
Лама 70B
Лама 405B

Самыя апошнія версіі (Llama 3.1 8B, Llama 3.1 70B і Llama 3.1 405B) былі выпушчаны ў ліпені 2024 г. Гэтыя мадэлі навучаюцца на шырокім спектры крыніц даных, такіх як вэб-старонкі на розных мовах, публічны код, файлы, даступныя ў інтэрнэце, і сінтэтычныя даныя, створаныя іншымі сістэмамі штучнага інтэлекту.

Llama 3.1 8B і 70B - гэта кампактныя мадэлі, якія могуць працаваць з рознымі прыладамі ад ноўтбукаў да сервераў. З іншага боку, Llama 3.1 405B - гэта буйнамаштабная мадэль, якая звычайна патрабуе абсталявання цэнтра апрацоўкі дадзеных. Нягледзячы на тое, што меншыя мадэлі могуць быць не такімі магутнымі, як 405B, яны прапануюць больш высокую прадукцыйнасць і аптымізаваны для памяншэння памяці і затрымкі.

Усе мадэлі Llama маюць кантэкстнае акно з 128 000 токенаў, што дазваляе ім апрацоўваць каля 100 000 слоў (або 300 старонак тэксту). Гэта прыкладна даўжыня такіх кніг, як «Навальнічны перавал» або «Гары Потэр і вязень Азкабана». Доўгае кантэкстнае акно дапамагае мадэлі захоўваць інфармацыю з апошніх дакументаў і даных, зніжаючы рызыку адхілення ад тэмы.

Што можа зрабіць лама?

Як і іншыя генератыўныя мадэлі штучнага інтэлекту, Llama можа дапамагчы з рознымі задачамі, такімі як кадаванне, адказы на простыя матэматычныя пытанні і абагульненне дакументаў на васьмі мовах: англійскай, нямецкай, французскай, італьянскай, партугальскай, хіндзі, іспанскай і тайскай. Ён можа апрацоўваць большасць тэкставых задач, такіх як аналіз файлаў, такіх як PDF-файлы і электронныя табліцы, але ў цяперашні час ён не мае магчымасці ствараць або апрацоўваць выявы - тое, што можа змяніцца ў будучыні.

Мадэлі Llama могуць інтэгравацца са староннімі праграмамі, інструментамі і API для выканання розных задач. Яны настроены на выкарыстанне Brave Search для адказаў на пытанні аб бягучых падзеях, Wolfram Alpha API для матэматычных і навуковых запытаў і інтэрпрэтатара Python для праверкі кода. Згодна з Meta, Llama 3.1 можа нават выкарыстоўваць некаторыя інструменты, якім яна не праходзіла спецыяльнае навучанне, хоць надзейнасць гэтай функцыі пакуль нявызначаная.

Дзе можна выкарыстоўваць Llama?

Калі вы хочаце падключыцца непасрэдна да Llama, чат-бот Meta AI падтрымліваецца на такіх платформах, як Facebook Messenger, WhatsApp, Instagram, Oculus і Meta.ai.

Для распрацоўшчыкаў Llama даступны для загрузкі і можа быць маштабаваны да некалькіх папулярных воблачных платформаў. Meta супрацоўнічае з больш чым 25 кампаніямі для размяшчэння Llama, уключаючы Nvidia, Databricks, Groq, Dell і Snowflake. Многія з гэтых партнёраў прадастаўляюць дадатковыя інструменты, якія дазваляюць Llama атрымліваць доступ да прапрыетарных даных або працаваць больш эфектыўна.

Meta прапануе выкарыстоўваць меншыя мадэлі Llama, у прыватнасці 8B і 70B, для агульных мэтаў, такіх як запуск чат-ботаў або стварэнне кода. З іншага боку, большая Llama 405B больш падыходзіць для такіх задач, як перагонка мадэляў, якая прадугледжвае перадачу ведаў ад большай мадэлі да меншай, а таксама генерацыю сінтэтычных даных для навучання іншых мадэляў.

Распрацоўшчыкі, якія працуюць з праграмамі з больш чым 700 мільёнамі карыстальнікаў штомесяц, павінны набыць спецыяльную ліцэнзію ў Meta для доступу да Llama, і гэта будзе прадастаўлена на меркаванне Meta.

Якія інструменты прапануе Meta для Llama?

Meta прадставіла некалькі інструментаў для паляпшэння бяспекі Llama:

Llama Guard: Структура мадэрацыі, якая вызначае праблемнае змесціва, такое як распальванне нянавісці, самапашкоджанне і парушэнне аўтарскіх правоў.
Prompt Guard: Інструмент, спецыяльна распрацаваны для абароны Llama ад шкодных паведамленняў, якія імкнуцца абыйсці меры бяспекі.
CyberSecEval: Пакет ацэнкі рызыкі кібербяспекі, які ацэньвае бяспеку мадэлі, засяродзіўшы ўвагу на такіх пагрозах, як аўтаматызаваная сацыяльная інжынерыя і наступальныя кібердзейнасці.

Напрыклад, Llama Guard можа выяўляць шкодны або незаконны кантэнт, які ўводзіцца або ствараецца ў Llama, што дазваляе распрацоўшчыкам наладжваць, якія катэгорыі блакіруюцца. Prompt Guard засяроджваецца на абароне ад «атак з ін’екцыяй паведамленняў», якія спрабуюць маніпуляваць мадэллю. CyberSecEval прапануе тэсты для ацэнкі рызык бяспекі, звязаных з мадэлямі Llama.

Абмежаванні ламы

У Llama, як і ў іншых генератыўных мадэляў штучнага інтэлекту, ёсць свае абмежаванні і патэнцыйныя рызыкі. Адна з галоўных праблем заключаецца ў тым, ці выкарыстоўвала Meta абароненыя аўтарскім правам матэрыялы для навучання Ламы. Калі гэта так, карыстальнікі могуць пагражаць адказнасцю за любы абаронены аўтарскім правам кантэнт, які стварае мадэль.

Нядаўнія справаздачы паказваюць, што Meta выкарыстоўвае электронныя кнігі, абароненыя аўтарскім правам, для навучання штучнаму інтэлекту, нягледзячы на атрыманне юрыдычных папярэджанняў. Кампанія таксама ўключае кантэнт з Instagram і Facebook у навучанне мадэлям, што ўскладняе адмову карыстальнікаў. Meta сутыкнулася са шматлікімі іскамі, у тым ліку ад такіх аўтараў, як Сара Сільверман, якія сцвярджаюць, што кампанія выкарыстоўвала матэрыялы, абароненыя аўтарскім правам, без дазволу.

Важным момантам з’яўляецца праграмаванне, бо Llama можа ствараць памылковы або небяспечны код. Вельмі важна, каб распрацоўшчыкі правяралі любы код, згенераваны штучным інтэлектам, перш чым укараняць яго ў свае прыкладанні.

У той час як мадэль Meta Llama прапануе значную гнуткасць і магчымасці для распрацоўшчыкаў, важна прызнаць патэнцыйныя рызыкі і абмежаванні, звязаныя з ёй.

–

Прадстаўлена Code Labs Academy – Ваш вядучы Навучальны онлайн-кемп па кадаванні для будучых тэхналагічных наватараў.