17. september 2024
Meta je, tako kot mnoga druga vodilna tehnološka podjetja, razvila lasten generativni model umetne inteligence, znan kot Llama. Tisto, kar ločuje Llamo, je njena odprta narava, ki razvijalcem omogoča, da jo prenesejo in uporabljajo z veliko svobodo, čeprav je treba upoštevati nekatere pogoje. Ta pristop je v nasprotju z modeli, kot je Anthropicov Claude, GPT-4o OpenAI (motor za ChatGPT) in Googlov Gemini, ki sta na voljo izključno prek API-jev.
Da bi razvijalcem omogočili večjo prilagodljivost, je Meta sodelovala s ponudniki storitev v oblaku, kot so AWS, Google Cloud in Microsoft Azure, da bi ponudila različice Llame, ki gostujejo v oblaku. Poleg tega je Meta zgradila orodja, ki razvijalcem poenostavljajo postopek za natančno nastavitev in prilagajanje modela, da ustreza njihovim posebnim zahtevam.
Spodaj je podroben opis Llame, vključno s tem, kaj zmore, različne različice, ki jih ponuja, in kako jo lahko učinkovito uporabljate.
Kaj je Llama?
Llama ni le en model; zajema vrsto modelov, kot so:
-
Lama 8B
-
Lama 70B
-
Lama 405B
Najnovejše različice (Llama 3.1 8B, Llama 3.1 70B in Llama 3.1 405B) so bile izdane julija 2024. Ti modeli se usposabljajo na številnih virih podatkov, kot so spletne strani v različnih jezikih, javna koda, datoteke, dostopne na spletu., in sintetični podatki, ki jih ustvarijo drugi sistemi AI.
Llama 3.1 8B in 70B sta kompaktna modela, ki lahko poganjata različne naprave od prenosnikov do strežnikov. Llama 3.1 405B pa je obsežen model, ki običajno zahteva strojno opremo podatkovnega centra. Medtem ko manjši modeli morda niso tako zmogljivi kot 405B, ponujajo hitrejše delovanje in so optimizirani za zmanjšano shranjevanje in zakasnitev.
Vsi modeli Llama imajo kontekstno okno s 128.000 žetoni, kar jim omogoča obdelavo približno 100.000 besed (ali 300 strani besedila). To je približno dolžina knjig, kot sta Wuthering Heights ali Harry Potter in jetnik iz Azkabana. Dolgo kontekstno okno pomaga modelu ohraniti informacije iz nedavnih dokumentov in podatkov, kar zmanjša tveganje, da bi zašli s teme.
Kaj lahko naredi Llama?
Tako kot drugi generativni modeli umetne inteligence lahko tudi Llama pomaga pri različnih nalogah, kot so kodiranje, odgovarjanje na preprosta matematična vprašanja in povzemanje dokumentov v osmih jezikih: angleščini, nemščini, francoščini, italijanščini, portugalščini, hindijščini, španščini in tajščini. Lahko obravnava večino besedilnih nalog, kot je analiza datotek, kot so PDF-ji in preglednice, vendar trenutno nima možnosti ustvarjanja ali obdelave slik – nekaj, kar bi se lahko spremenilo v prihodnosti.
Modeli Llama se lahko integrirajo z aplikacijami, orodji in API-ji tretjih oseb za izvajanje različnih nalog. Konfigurirani so tako, da uporabljajo Brave Search za odgovarjanje na vprašanja o aktualnih dogodkih, Wolfram Alpha API za matematične in naravoslovne poizvedbe ter tolmač Python za preverjanje kode. Po besedah Mete lahko Llama 3.1 celo uporablja nekatera orodja, za katera ni bil izrecno usposobljen, čeprav je zanesljivost te funkcije še vedno negotova.
Kje lahko uporabite Llamo?
Če se želite neposredno povezati z Llamo, je izkušnja klepetalnega robota Meta AI podprta na platformah, kot so Facebook Messenger, WhatsApp, Instagram, Oculus in Meta.ai.
Za razvijalce je Llama na voljo za prenos in se lahko razširi na več priljubljenih platform v oblaku. Meta je sodelovala z več kot 25 podjetji za gostovanje Llame, vključno z Nvidia, Databricks, Groq, Dell in Snowflake. Mnogi od teh partnerjev ponujajo dodatna orodja, ki Llami omogočajo dostop do lastniških podatkov ali učinkovitejše delovanje.
Meta predlaga uporabo manjših modelov Llama, zlasti 8B in 70B, za splošne namene, kot je zagon chatbotov ali ustvarjanje kode. Po drugi strani pa je večja Llama 405B primernejša za naloge, kot je destilacija modela, ki vključuje prenos znanja iz večjega modela v manjšega, kot tudi generiranje sintetičnih podatkov za usposabljanje drugih modelov.
Razvijalci, ki upravljajo aplikacije z več kot 700 milijoni mesečnih uporabnikov, morajo od Mete pridobiti posebno licenco za dostop do Llame, ki jo bo Meta podelila po lastni presoji.
Kakšna orodja ponuja Meta za Llamo?
Meta je predstavila več orodij za izboljšanje varnosti Llame:
-
Llama Guard: okvir za moderiranje, ki identificira problematično vsebino, kot je sovražni govor, samopoškodovanje in kršitev avtorskih pravic.
-
Prompt Guard: Orodje, posebej zasnovano za zaščito Llame pred škodljivimi sporočili, ki poskušajo zaobiti njene varnostne ukrepe.
-
CyberSecEval: Paket za oceno tveganja kibernetske varnosti, ki ocenjuje varnost modela in se osredotoča na grožnje, kot so avtomatiziran socialni inženiring in žaljive kibernetske dejavnosti.
Llama Guard lahko na primer zazna škodljivo ali nezakonito vsebino, ki je vnesena ali ustvarjena v Llamo, kar razvijalcem omogoča, da prilagodijo, katere kategorije so blokirane. Prompt Guard se osredotoča na obrambo pred "napadi z vbrizgavanjem sporočil", ki poskušajo manipulirati z modelom. CyberSecEval ponuja merila za ocenjevanje varnostnih tveganj, povezanih z modeli Llama.
Llamine omejitve
Llama ima, tako kot drugi generativni modeli umetne inteligence, svoje omejitve in potencialna tveganja. Eden glavnih pomislekov je, ali je Meta uporabila avtorsko zaščiteno gradivo za treniranje Llame. Če je temu tako, se lahko uporabniki soočijo z odgovornostjo za avtorsko zaščiteno vsebino, ki jo ustvari model.
Nedavna poročila kažejo, da je Meta uporabljala avtorsko zaščitene e-knjige za usposabljanje AI, čeprav je prejela pravna opozorila. Podjetje prav tako vključuje vsebino iz Instagrama in Facebooka v svoje usposabljanje modelov, kar uporabnikom otežuje odjavo. Meta se sooča s številnimi tožbami, vključno s tožbo avtorjev, kot je Sarah Silverman, ki trdijo, da je podjetje brez dovoljenja uporabilo avtorsko zaščiteno gradivo.
Pomemben dejavnik je programiranje, saj lahko Llama ustvari napako ali nevarno kodo. Ključnega pomena je, da imajo razvijalci človeški strokovnjak, ki pregleda vsako kodo, ustvarjeno z umetno inteligenco, preden jo implementira v svoje aplikacije.
Medtem ko Metin model Llama ponuja precejšnjo prilagodljivost in priložnosti za razvijalce, je pomembno prepoznati morebitna tveganja in omejitve, ki prihajajo z njim.
–
Prinaša Code Labs Academy – Vaš vodilni Spletni tečaj za kodiranje za prihodnje tehnološke inovatorje.