Kas ir metalama? Visaptverošs skatījums uz atvērtā AI modeli izstrādātājiem

Atjaunināts vietnē September 17, 2024 5 minūtes lasīt

2024. gada 17. septembris

Meta, tāpat kā daudzi citi vadošie tehnoloģiju uzņēmumi, ir izstrādājusi savu ģeneratīvo AI modeli, kas pazīstams kā Llama. Llama atšķir tās atvērtais raksturs, kas ļauj izstrādātājiem to lejupielādēt un izmantot ar ievērojamu brīvību, lai gan ir daži nosacījumi, kas jāpatur prātā. Šī pieeja ir pretrunā ar tādiem modeļiem kā Anthropic’s Claude, OpenAI’s GPT-4o (dzinējs aiz ChatGPT) un Google Gemini, kas ir pieejami tikai ar API.

Lai sniegtu izstrādātājiem lielāku elastību, Meta ir sadarbojusies ar mākoņpakalpojumu sniedzējiem, piemēram, AWS, Google Cloud un Microsoft Azure, lai piedāvātu mākoņos mitinātas Llama versijas. Turklāt Meta ir izveidojis rīkus, kas vienkāršo procesu izstrādātājiem, lai precīzi noregulētu un pielāgotu modeli, lai tas atbilstu viņu īpašajām prasībām.

Tālāk ir sniegts detalizēts Llama apraksts, tostarp tas, ko tā var darīt, dažādās versijas, ko tā piedāvā un kā jūs varat to efektīvi izmantot.

Kas ir Lama?

Lama nav tikai viens modelis; tas ietver virkni modeļu, piemēram:

Lama 8B
Lama 70B
Lama 405B

Jaunākās versijas (Llama 3.1 8B, Llama 3.1 70B un Llama 3.1 405B) tika izlaistas 2024. gada jūlijā. Šie modeļi ir apmācīti, izmantojot dažādus datu avotus, piemēram, tīmekļa lapas dažādās valodās, publisko kodu, tiešsaistē pieejamos failus., un sintētiskie dati, ko rada citas AI sistēmas.

Llama 3.1 8B un 70B ir kompakti modeļi, kas var darbināt dažādas ierīces no klēpjdatoriem līdz serveriem. No otras puses, Llama 3.1 405B ir liela mēroga modelis, kam parasti nepieciešama datu centra aparatūra. Lai gan mazākie modeļi var nebūt tik jaudīgi kā 405B, tie piedāvā ātrāku veiktspēju un ir optimizēti, lai samazinātu krātuvi un latentumu.

Visiem Llama modeļiem ir konteksta logs ar 128 000 marķieriem, kas ļauj tiem apstrādāt aptuveni 100 000 vārdu (vai 300 teksta lapas). Tas ir aptuveni tādu grāmatu garums kā Wuthering Heights vai Harijs Poters un Azkabanas gūsteknis. Garš konteksta logs palīdz modelim saglabāt informāciju no jaunākajiem dokumentiem un datiem, samazinot risku novirzīties no tēmas.

Ko var darīt lama?

Tāpat kā citi ģeneratīvie AI modeļi, Llama var palīdzēt veikt dažādus uzdevumus, piemēram, kodēt, atbildēt uz vienkāršiem matemātikas jautājumiem un apkopot dokumentus astoņās valodās: angļu, vācu, franču, itāļu, portugāļu, hindi, spāņu un taju. Tas var veikt lielāko daļu uz tekstu balstītu uzdevumu, piemēram, analizēt failus, piemēram, PDF un izklājlapas, taču pašlaik tai nav iespēju ģenerēt vai apstrādāt attēlus — tas var mainīties nākotnē.

Lama modeļus var integrēt ar trešo pušu lietotnēm, rīkiem un API, lai veiktu dažādus uzdevumus. Tie ir konfigurēti, lai izmantotu Brave Search, lai atbildētu uz jautājumiem par aktuālajiem notikumiem, Wolfram Alpha API matemātikas un zinātnes vaicājumiem un Python tulku koda validācijai. Saskaņā ar Meta teikto, Llama 3.1 var pat izmantot dažus rīkus, kas nav īpaši apmācīti, lai gan šīs funkcijas uzticamība joprojām nav skaidra.

Kur var izmantot lamu?

Ja vēlaties tieši sazināties ar Lamu, Meta AI tērzēšanas robota pieredze tiek atbalstīta tādās platformās kā Facebook Messenger, WhatsApp, Instagram, Oculus un Meta.ai.

Izstrādātājiem Llama ir pieejama lejupielādei, un to var pielāgot vairākām populārām mākoņu platformām. Meta ir sadarbojusies ar vairāk nekā 25 uzņēmumiem, lai uzņemtu Llama, tostarp Nvidia, Databricks, Groq, Dell un Snowflake. Daudzi no šiem partneriem nodrošina papildu rīkus, kas ļauj Llama piekļūt patentētiem datiem vai darboties efektīvāk.

Meta iesaka izmantot mazākos Llama modeļus, īpaši 8B un 70B, vispārīgiem mērķiem, piemēram, tērzēšanas robotu palaišanai vai koda izveidei. No otras puses, lielākais Llama 405B ir vairāk piemērots tādiem uzdevumiem kā modeļu destilācija, kas ietver zināšanu nodošanu no lielāka modeļa uz mazāku, kā arī sintētisko datu ģenerēšanu, lai apmācītu citus modeļus.

Izstrādātājiem, kas izmanto lietojumprogrammas ar vairāk nekā 700 miljoniem ikmēneša lietotāju, ir jāiegūst īpaša licence no Meta, lai piekļūtu Llama, un tā tiks piešķirta pēc Meta ieskatiem.

Kādus rīkus Meta piedāvā lamam?

Meta ir ieviesusi vairākus rīkus, lai uzlabotu Lama drošību:

Lamu aizsargs: moderēšanas sistēma, kas identificē problemātisku saturu, piemēram, naida runu, paškaitējumu un autortiesību pārkāpumus.

2. Prompt Guard: rīks, kas īpaši izstrādāts, lai aizsargātu lamu no kaitīgiem ziņojumiem, kas cenšas apiet tās drošības pasākumus.

CyberSecEval: kiberdrošības riska novērtēšanas komplekts, kas novērtē modeļa drošību, koncentrējoties uz tādiem draudiem kā automatizēta sociālā inženierija un aizskarošas kiberdarbības.

Piemēram, Llama Guard var atklāt kaitīgu vai nelegālu saturu, kas tiek ievadīts vai ģenerēts Llama, ļaujot izstrādātājiem pielāgot, kuras kategorijas tiek bloķētas. Prompt Guard koncentrējas uz aizsardzību pret “ziņojumu ievadīšanas uzbrukumiem”, kas mēģina manipulēt ar modeli. CyberSecEval piedāvā etalonus ar Llama modeļiem saistīto drošības risku novērtēšanai.

Lamas ierobežojumi

Lamai, tāpat kā citiem ģeneratīvajiem AI modeļiem, ir savi ierobežojumi un iespējamie riski. Viena no galvenajām bažām ir par to, vai Meta izmantoja ar autortiesībām aizsargātus materiālus, lai apmācītu lamu. Ja tas tā ir, lietotāji var uzņemties atbildību par jebkuru ar autortiesībām aizsargātu saturu, ko modelis ģenerē.

Jaunākie ziņojumi liecina, ka Meta ir izmantojusi ar autortiesībām aizsargātas e-grāmatas mākslīgā intelekta apmācībai, neskatoties uz to, ka ir saņēmis juridiskus brīdinājumus. Uzņēmums modeļu apmācībā iekļauj arī saturu no Instagram un Facebook, tādējādi lietotājiem ir grūti atteikties. Meta saskaras ar vairākām tiesas prāvām, tostarp vienu no tādiem autoriem kā Sāra Silvermena, kuri apgalvo, ka uzņēmums bez atļaujas ir izmantojis ar autortiesībām aizsargātu materiālu.

Svarīgs apsvērums ir programmēšana, jo Llama var radīt kļūdainu vai nedrošu kodu. Ir ļoti svarīgi, lai izstrādātāji liktu cilvēku ekspertam pārskatīt jebkuru mākslīgā intelekta ģenerēto kodu pirms tā ieviešanas savās lietojumprogrammās.

Lai gan Meta’s Llama modelis piedāvā ievērojamu elastību un iespējas izstrādātājiem, ir svarīgi apzināties iespējamos riskus un ierobežojumus, kas ar to saistīti.

–

Piegādāja Code Labs Academy — jūsu vadošā tiešsaistes kodēšanas sākumkampa Nākotnes tehnoloģiju novatoriem.