2024ko irailaren 17a
Metak, puntako beste teknologia-enpresa askok bezala, Llama izenez ezagutzen den AI eredu sortzailea garatu du. Llama bereizten duena bere izaera irekia da, garatzaileek askatasun handiz deskargatu eta erabiltzeko aukera ematen diena, nahiz eta kontuan izan beharreko baldintza batzuk egon. Ikuspegi honek Anthropic-en Claude, OpenAI-ren GPT-4o ([ChatGPT] atzean dagoen motorra)(/news/ai-at-your-) bezalako ereduekin kontrajartzen du. fingertips-chatgpt-app-now-available-for-mac-2024-07-02)) eta Google-ren Gemini, APIen bidez soilik eskuragarri daudenak.
Garatzaileei malgutasun handiagoa emateko, Meta hodeiko zerbitzu hornitzaileekin lankidetzan aritu da, hala nola AWS, Google Cloud eta Microsoft Azure, hodeian ostatatutako Llama bertsioak eskaintzeko. Horrez gain, Metak tresnak eraiki ditu garatzaileek prozesua sinplifikatzen duten eredua doitzeko eta egokitzeko beren eskakizun zehatzak betetzeko.
Jarraian, Llamaren deskribapen zehatza dago, zer egin dezakeen, eskaintzen dituen bertsio desberdinak eta modu eraginkorrean erabil dezakezun barne.
Zer da Llama?
Llama ez da eredu bakarra; hainbat eredu biltzen ditu, hala nola:
-
Llama 8B
-
Llama 70B
-
Llama 405B
Bertsio berrienak (Llama 3.1 8B, Llama 3.1 70B eta Llama 3.1 405B) 2024ko uztailean kaleratu ziren. Eredu hauek datu-iturri ugaritan trebatzen dira, hala nola hizkuntza ezberdinetako web orrialdeak, kode publikoa, sarean eskuragarri dauden fitxategiak., eta beste AI sistema batzuek sortutako datu sintetikoak.
Llama 3.1 8B eta 70B modelo trinkoak dira, ordenagailu eramangarrietatik zerbitzarietara hainbat gailu exekutatu ditzaketenak. Llama 3.1 405B, berriz, eskala handiko eredua da, normalean datu-zentroko hardwarea behar duena. Modelo txikiek 405B bezain indartsuak ez izan arren, errendimendu azkarragoa eskaintzen dute eta biltegiratze eta latentzia murrizteko optimizatuta daude.
Llama modelo guztiek 128.000 tokeneko testuinguru-leihoa dute, 100.000 hitz inguru (edo 300 testu orrialde) kudeatzeko aukera emanez. Gutxi gorabehera, Wuthering Heights edo Harry Potter eta Azkabango presoa bezalako liburuen luzera da. Testuinguru luzeko leiho batek ereduari azken dokumentu eta datuen informazioa gordetzen laguntzen dio, gaitik kanpo uzteko arriskua murrizten du.
Zer egin dezake Llamak?
Beste sorkuntza AI ereduak bezala, Llamak hainbat zereginetan lagun dezake, hala nola, kodetzea, matematikako galdera errazak erantzutea eta dokumentuak zortzi hizkuntzatan laburtzea: ingelesa, alemana, frantsesa, italiera, portugesa, hindia, gaztelania eta thailandiera. Testuan oinarritutako zeregin gehienak kudeatu ditzake, hala nola, PDFak eta kalkulu-orriak bezalako fitxategiak aztertzea, baina gaur egun ez du irudiak sortzeko edo prozesatzeko gaitasunik, etorkizunean alda daitekeen zerbait.
Llama ereduak hirugarrenen aplikazioekin, tresnekin eta APIekin integra daitezke hainbat zeregin egiteko. Brave Search uneko gertaeren inguruko galderei erantzuteko, Wolfram Alpha APIa matematika eta zientzia kontsultak egiteko eta Python interprete bat kodea balioztatzeko konfiguratuta daude. Metaren arabera, Llama 3.1-ek esplizituki trebatu ez dituen tresna batzuk ere erabil ditzake, nahiz eta funtzio honen fidagarritasuna oraindik ez den ziur egon.
Non erabil dezakezu Llama?
Llama-rekin zuzenean konektatu nahi baduzu, Meta AI chatbot esperientzia Facebook Messenger, WhatsApp, Instagram, Oculus eta Meta.ai bezalako plataformetan onartzen da.
Garatzaileentzat, Llama deskargatzeko eskuragarri dago eta hainbat hodeiko plataforma ezagunetara eskala daiteke. Meta 25 enpresa baino gehiagorekin bat egin du Llama ostatatzeko, Nvidia, Databricks, Groq, Dell eta Snowflake barne. Bazkide horietako askok tresna osagarriak eskaintzen dituzte Llamari jabedun datuetara sartzeko edo modu eraginkorragoan exekutatzeko.
Metak iradokitzen du Llama eredu txikiagoak erabiltzea, zehazki 8B eta 70B, helburu orokorretarako, esate baterako, chatbot-ak exekutatzeko edo kodea sortzeko. Bestalde, Llama 405B handiagoa da ereduen destilazioa bezalako zereginetarako, hau da, ezagutzak eredu handiago batetik txikiago batera transferitzeaz gain, datu sintetikoak sortzea beste eredu batzuk entrenatzeko.
Hilero 700 milioi erabiltzaile baino gehiago dituzten aplikazioak kudeatzen dituzten garatzaileek Meta-ren lizentzia berezi bat eskuratu behar dute Llamara sartzeko, eta hori Metaren erabakiz emango da.
Zer tresna eskaintzen ditu Metak Llamarentzat?
Metak Llamaren segurtasuna hobetzeko hainbat tresna aurkeztu ditu:
-
Llama Guard: eduki problematikoak identifikatzen dituen moderazio-esparrua, hala nola gorrotoaren hizkera, autokaltea eta copyright-urraketa.
-
Prompt Guard: Llama bere segurtasun neurriak saihestu nahi dituzten mezu kaltegarrietatik babesteko bereziki diseinatutako tresna.
-
CyberSecEval: ereduaren segurtasuna ebaluatzen duen zibersegurtasuneko arriskuen ebaluazio-multzoa, ingeniaritza sozial automatizatua eta ziber-jarduera iraingarriak bezalako mehatxuetan zentratuz.
Adibidez, Llama Guard-ek Llaman sartu edo sortzen den eduki kaltegarri edo legez kanpoko detektatu dezake, garatzaileek blokeatutako kategoriak pertsonalizatzeko aukera emanez. Prompt Guard eredua manipulatzen saiatzen diren "mezuen injekzio erasoen" aurka defendatzen zentratzen da. CyberSecEval-ek Llama ereduekin lotutako segurtasun-arriskuak ebaluatzeko erreferentziak eskaintzen ditu.
Llamaren mugak
Llamak, beste sormenezko AI ereduak bezala, bere mugak eta arrisku potentzialak ditu. Kezka nagusietako bat Metak egile eskubidedun materialak erabili ote zituen Llama trebatzeko. Horrela bada, erabiltzaileek erantzukizuna izan dezakete ereduak sortzen duen copyrightdun edukiengatik.
Azken txostenek adierazten dute Meta copyrightdun liburu elektronikoak erabiltzen ari dela AI prestakuntzarako, legezko abisuak jaso arren. Konpainiak Instagram eta Facebook-eko edukiak ere sartzen ditu bere ereduko prestakuntzan, erabiltzaileek uko egitea zailduz. Metak hainbat auzitara jo behar du, besteak beste, Sarah Silverman bezalako egileen bat, konpainiak copyrightdun materiala baimenik gabe erabili duela diotenak.
Kontu garrantzitsu bat programazioa da, Llamak kode akatsak edo seguruak ekoitzi ditzakeelako. Garrantzitsua da garatzaileek giza aditu batek AI-k sortutako edozein kodea berrikustea beren aplikazioetan inplementatu aurretik.
Meta-ren Llama ereduak garatzaileei malgutasun eta aukera handiak eskaintzen dizkien arren, garrantzitsua da horrek dakarren arrisku eta muga potentzialak aintzat hartzea.
–
Code Labs Academy-k ekarri dizu: Zure liderra Online Coding Bootcamp Etorkizuneko teknologia berritzaileentzat.