Kas yra Meta Lama? Išsamus atvirojo AI modelio, skirto kūrėjams, žvilgsnis

Kas yra Meta Lama? Išsamus atvirojo AI modelio, skirto kūrėjams, žvilgsnis
2024 m. rugsėjo 17 d

„Meta“, kaip ir daugelis kitų pirmaujančių technologijų įmonių, sukūrė savo generacinį AI modelį, žinomą kaip Llama. „Llama“ išskiria atvirą pobūdį, leidžiantį kūrėjams ją atsisiųsti ir naudoti gana laisvai, nors reikia nepamiršti tam tikrų sąlygų. Šis metodas prieštarauja tokiems modeliams kaip Anthropic's Claude, OpenAI's GPT-4o (variklis už ChatGPT) ir Google Gemini, kurie pasiekiami tik per API.

Siekdama suteikti kūrėjams daugiau lankstumo, „Meta“ bendradarbiauja su debesų paslaugų teikėjais, tokiais kaip AWS, „Google Cloud“ ir „Microsoft Azure“, kad pasiūlytų debesyje priglobtas „Llama“ versijas. Be to, „Meta“ sukūrė įrankius, kurie supaprastina kūrėjų tobulinimo ir modelio pritaikymo procesą, kad atitiktų konkrečius reikalavimus.

Žemiau pateikiamas išsamus Llama aprašymas, įskaitant tai, ką ji gali padaryti, įvairias jos siūlomas versijas ir kaip galite ją efektyviai naudoti.

Kas yra Lama?

Lama nėra tik vienas modelis; ji apima daugybę modelių, tokių kaip:

  • Lama 8B

  • Lama 70B

  • Lama 405B

Naujausios versijos (Llama 3.1 8B, Llama 3.1 70B ir Llama 3.1 405B) buvo išleistos 2024 m. liepos mėn. Šie modeliai mokomi naudojant įvairius duomenų šaltinius, tokius kaip tinklalapiai skirtingomis kalbomis, viešasis kodas, failai, pasiekiami internete., ir sintetiniai duomenys, sukurti kitų AI sistemų.

Llama 3.1 8B ir 70B yra kompaktiški modeliai, galintys paleisti įvairius įrenginius nuo nešiojamųjų kompiuterių iki serverių. Kita vertus, „Llama 3.1 405B“ yra didelio masto modelis, kuriam paprastai reikia duomenų centro techninės įrangos. Nors mažesni modeliai gali būti ne tokie galingi kaip 405B, jie pasižymi greitesniu našumu ir yra optimizuoti, kad būtų sumažinta saugykla ir delsa.

Visuose „Llama“ modeliuose yra 128 000 žetonų kontekstinis langas, leidžiantis tvarkyti apie 100 000 žodžių (arba 300 puslapių teksto). Tai maždaug tiek knygų, kaip „Wuthering Heights“ ar „Haris Poteris ir Azkabano kalinys“. Ilgas konteksto langas padeda modeliui išsaugoti informaciją iš naujausių dokumentų ir duomenų, todėl sumažėja rizika nuklysti nuo temos.

Ką gali padaryti lama?

Kaip ir kiti generaciniai AI modeliai, Llama gali padėti atlikti įvairias užduotis, pavyzdžiui, koduoti, atsakyti į paprastus matematikos klausimus ir apibendrinti dokumentus aštuoniomis kalbomis: anglų, vokiečių, prancūzų, italų, portugalų, hindi, ispanų ir tajų. Jis gali atlikti daugumą tekstu pagrįstų užduočių, pvz., analizuoti failus, pvz., PDF ir skaičiuokles, tačiau šiuo metu jis negali generuoti ar apdoroti vaizdų – tai gali pasikeisti ateityje.

„Llama“ modelius galima integruoti su trečiųjų šalių programomis, įrankiais ir API, kad būtų galima atlikti įvairias užduotis. Jie sukonfigūruoti naudoti „Brave Search“, kad atsakytų į klausimus apie dabartinius įvykius, „Wolfram Alpha“ API matematikos ir gamtos mokslų užklausoms ir „Python“ vertėjas kodui patvirtinti. „Meta“ teigimu, „Llama 3.1“ netgi gali naudoti kai kuriuos įrankius, kurių ji nebuvo specialiai apmokyta, nors šios funkcijos patikimumas vis dar neaiškus.

Kur galite naudoti lamą?

Jei norite tiesiogiai susisiekti su Llama, „Meta AI“ pokalbių roboto patirtis palaikoma tokiose platformose kaip „Facebook Messenger“, „WhatsApp“, „Instagram“, „Oculus“ ir „Meta.ai“.

Kūrėjai gali atsisiųsti „Llama“ ir gali būti pritaikyti kelioms populiarioms debesų platformoms. „Meta“ bendradarbiauja su daugiau nei 25 kompanijomis, kurios priglobia „Llama“, įskaitant „Nvidia“, „Databricks“, „Groq“, „Dell“ ir „Snowflake“. Daugelis šių partnerių teikia papildomų įrankių, leidžiančių „Llama“ pasiekti patentuotus duomenis arba veikti efektyviau.

„Meta“ siūlo naudoti mažesnius „Llama“ modelius, ypač 8B ir 70B, bendriems tikslams, pavyzdžiui, paleisti pokalbių robotus arba kurti kodą. Kita vertus, didesnis Llama 405B yra tinkamesnis tokioms užduotims kaip modelio distiliavimas, kuris apima žinių perkėlimą iš didesnio modelio į mažesnį, taip pat sintetinių duomenų generavimą kitiems modeliams mokyti.

Kūrėjai, valdantys programas su daugiau nei 700 milijonų vartotojų per mėnesį, turi įsigyti specialią „Meta“ licenciją, kad galėtų pasiekti „Llama“, ir tai bus suteikta „Meta“ nuožiūra.

Kokius įrankius „Meta“ siūlo lamai?

„Meta“ pristatė keletą įrankių, kad pagerintų „Llama“ saugumą:

  1. Lama Guard: moderavimo sistema, identifikuojanti probleminį turinį, pvz., neapykantą kurstančią kalbą, savęs žalojimą ir autorių teisių pažeidimą.

  2. Prompt Guard: įrankis, specialiai sukurtas apsaugoti lamą nuo žalingų pranešimų, kuriais siekiama apeiti jos saugumo priemones.

  3. CyberSecEval: kibernetinio saugumo rizikos vertinimo rinkinys, įvertinantis modelio saugumą, daugiausia dėmesio skiriant tokioms grėsmėms kaip automatizuota socialinė inžinerija ir įžeidžianti kibernetinė veikla.

Pavyzdžiui, „Llama Guard“ gali aptikti žalingą ar neteisėtą turinį, kuris įvedamas arba sugeneruotas „Llama“, todėl kūrėjai gali tinkinti, kurios kategorijos yra blokuojamos. Prompt Guard daugiausia dėmesio skiria gynybai nuo „pranešimų įpurškimo atakų“, kuriomis bandoma manipuliuoti modeliu. „CyberSecEval“ siūlo gaires, leidžiančias įvertinti su „Llama“ modeliais susijusią saugumo riziką.

Lamos apribojimai

Lama, kaip ir kiti generaciniai AI modeliai, turi savo apribojimų ir galimų pavojų. Vienas iš pagrindinių susirūpinimą keliančių klausimų yra tai, ar Meta naudojo autorių teisių saugomą medžiagą lamai mokyti. Tokiu atveju naudotojai gali būti atsakingi už bet kokį autorių teisių saugomą turinį, kurį sukuria modelis.

Naujausios ataskaitos rodo, kad Meta naudojo autorių teisių saugomas el. knygas dirbtinio intelekto mokymams, nepaisant to, kad gavo teisinius įspėjimus. Bendrovė taip pat įtraukia turinį iš Instagram ir Facebook į savo modelių mokymus, todėl vartotojams sunku atsisakyti. Meta susiduria su daugybe ieškinių, įskaitant vieną iš tokių autorių kaip Sarah Silverman, kurie teigia, kad įmonė be leidimo naudojo autorių teisių saugomą medžiagą.

Svarbus dalykas yra programavimas, nes Llama gali sukurti klaidingą arba nesaugų kodą. Labai svarbu, kad kūrėjai, prieš diegdami jį į savo programas, turėtų ekspertą, kuris peržiūrėtų bet kokį dirbtinio intelekto sukurtą kodą.

Nors „Meta's Llama“ modelis siūlo daug lankstumo ir galimybių kūrėjams, svarbu atpažinti galimą riziką ir apribojimus, susijusius su juo.

Jums atnešė Code Labs Academy – jūsų lyderis Online Coding Bootcamp Future Tech Innovators.

Vaizdo kreditai: Meta

Code Labs Academy © 2024 Visos teisės saugomos.