Mikä on Meta Llama? Kattava katsaus avoimeen AI-malliin kehittäjille

Päivitetty September 17, 2024 4 minuutteja luetaan

17. syyskuuta 2024

Meta, kuten monet muut johtavat teknologiayritykset, on kehittänyt oman generatiivisen tekoälymallinsa, joka tunnetaan nimellä Llama. Se, mikä erottaa Llaman muista, on sen avoin luonne, jonka avulla kehittäjät voivat ladata ja käyttää sitä huomattavan vapauden, vaikka joitakin ehtoja on pidettävä mielessä. Tämä lähestymistapa eroaa malleista, kuten Anthropic’s Claude, OpenAI’s GPT-4o ([ChatGPT:n] takana oleva moottori (/news/ai-at-your- fingertips-chatgpt-app-now-available-for-mac-2024-07-02)) ja Googlen Gemini, jotka ovat saatavilla vain sovellusliittymien kautta.

Antaakseen kehittäjille enemmän joustavuutta Meta on tehnyt yhteistyötä pilvipalveluntarjoajien, kuten AWS:n, Google Cloudin ja Microsoft Azuren, kanssa tarjotakseen Llaman pilvipalveluita. Lisäksi Meta on rakentanut työkaluja, jotka yksinkertaistavat kehittäjien prosessia hienosäätää ja mukauttaa mallia vastaamaan erityisvaatimuksiaan.

Alla on yksityiskohtainen kuvaus Llamasta, mukaan lukien mitä se voi tehdä, sen tarjoamat eri versiot ja kuinka voit käyttää sitä tehokkaasti.

Mikä on laama?

Laama ei ole vain yksi malli; se kattaa useita malleja, kuten:

Laama 8B
Laama 70B
Laama 405B

Uusimmat versiot (Llama 3.1 8B, Llama 3.1 70B ja Llama 3.1 405B) julkaistiin heinäkuussa 2024. Näitä malleja on koulutettu monenlaisiin tietolähteisiin, kuten erikielisiin verkkosivuihin, julkiseen koodiin, verkossa saatavilla oleviin tiedostoihin. ja muiden tekoälyjärjestelmien tuottamaa synteettistä dataa.

Llama 3.1 8B ja 70B ovat kompakteja malleja, jotka voivat käyttää erilaisia laitteita kannettavista tietokoneista palvelimiin. Llama 3.1 405B puolestaan on suuren mittakaavan malli, joka vaatii tyypillisesti konesalin laitteistoa. Vaikka pienemmät mallit eivät ehkä ole yhtä tehokkaita kuin 405B, ne tarjoavat nopeamman suorituskyvyn ja on optimoitu vähentämään tallennustilaa ja viivettä.

Kaikissa Llama-malleissa on 128 000 merkkiä sisältävä kontekstiikkuna, jonka avulla ne voivat käsitellä noin 100 000 sanaa (tai 300 sivua tekstiä). Tämä on suunnilleen saman pituisia kirjoja kuin Wuthering Heights tai Harry Potter ja Azkabanin vanki. Pitkä kontekstiikkuna auttaa mallia säilyttämään tiedot viimeaikaisista asiakirjoista ja tiedoista, mikä vähentää riskiä poiketa aiheesta.

Mitä laama voi tehdä?

Kuten muutkin generatiiviset tekoälymallit, Llama voi auttaa erilaisissa tehtävissä, kuten koodaamisessa, yksinkertaisiin matemaattisiin kysymyksiin vastaamisessa ja asiakirjojen yhteenvedossa kahdeksalla kielellä: englanniksi, saksaksi, ranskaksi, italiaksi, portugaliksi, hindiksi, espanjaksi ja thai. Se pystyy käsittelemään useimpia tekstipohjaisia tehtäviä, kuten tiedostojen, kuten PDF-tiedostojen ja laskentataulukoiden, analysointia, mutta tällä hetkellä sillä ei ole kykyä luoda tai käsitellä kuvia – mikä saattaa muuttua tulevaisuudessa.

Laama-mallit voidaan integroida kolmansien osapuolien sovelluksiin, työkaluihin ja sovellusliittymiin erilaisten tehtävien suorittamiseksi. Ne on määritetty käyttämään Brave Searchia vastaamaan ajankohtaisia tapahtumia koskeviin kysymyksiin, Wolfram Alpha API:a matematiikka- ja tiedekyselyihin ja Python-tulkkia koodin validointiin. Metan mukaan Llama 3.1 voi jopa käyttää joitain työkaluja, joihin sitä ei ole nimenomaisesti koulutettu, vaikka tämän ominaisuuden luotettavuus on vielä epävarma.

Missä voit käyttää laamaa?

Jos haluat muodostaa yhteyden suoraan Llamaan, Meta AI -chatbot-kokemusta tuetaan sellaisilla alustoilla kuin Facebook Messenger, WhatsApp, Instagram, Oculus ja Meta.ai.

Kehittäjille Llama on ladattavissa, ja se voidaan skaalata useille suosituille pilvialustoille. Meta on tehnyt yhteistyötä yli 25 yrityksen kanssa isännöidessään Llamaa, mukaan lukien Nvidia, Databricks, Groq, Dell ja Snowflake. Monet näistä kumppaneista tarjoavat lisätyökaluja, joiden avulla Llama voi käyttää omaa dataa tai toimia tehokkaammin.

Meta suosittelee pienempien Llama-mallien, erityisesti 8B:n ja 70B:n, käyttöä yleisiin tarkoituksiin, kuten chatbottien ajamiseen tai koodin luomiseen. Toisaalta suurempi Llama 405B soveltuu paremmin sellaisiin tehtäviin kuin mallitislaus, joka sisältää tiedon siirtämisen suuremmasta mallista pienempään sekä synteettisen datan luomiseen muiden mallien kouluttamiseksi.

Kehittäjien, joilla on yli 700 miljoonaa kuukausittaista käyttäjää, on hankittava Metalta erityinen lisenssi päästäkseen Llamaan, ja tämä myönnetään Metan harkinnan mukaan.

Mitä työkaluja Meta tarjoaa laamalle?

Meta on ottanut käyttöön useita työkaluja parantaakseen Llaman turvallisuutta:

Llama Guard: Valvontakehys, joka tunnistaa ongelmallisen sisällön, kuten vihapuheen, itsensä vahingoittamisen ja tekijänoikeusrikkomukset.
Prompt Guard: Työkalu, joka on erityisesti suunniteltu suojaamaan laamaa haitallisilta viesteiltä, jotka pyrkivät ohittamaan sen turvatoimenpiteet.
CyberSecEval: Kyberturvallisuuden riskinarviointipaketti, joka arvioi malliturvallisuutta keskittyen uhkiin, kuten automatisoituun sosiaaliseen manipulointiin ja hyökkääviin kybertoimintoihin.

Llama Guard voi esimerkiksi havaita haitallisen tai laittoman sisällön, joka on syötetty tai luotu Llamaan, jolloin kehittäjät voivat mukauttaa, mitkä luokat estetään. Prompt Guard keskittyy puolustautumiseen “viestinsyöttöhyökkäyksiä” vastaan, jotka yrittävät manipuloida mallia. CyberSecEval tarjoaa benchmarkit Llama-malleihin liittyvien turvallisuusriskien arvioimiseen.

Laaman rajoitukset

Lamalla, kuten muillakin generatiivisilla tekoälymalleilla, on rajoituksensa ja mahdolliset riskit. Yksi suurimmista huolenaiheista on, käyttikö Meta tekijänoikeuksilla suojattua materiaalia laaman kouluttamiseen. Jos näin on, käyttäjät voivat joutua vastuuseen mallin luomasta tekijänoikeudella suojatusta sisällöstä.

Viimeaikaiset raportit osoittavat, että Meta on käyttänyt tekijänoikeudella suojattuja e-kirjoja tekoälykoulutukseen huolimatta siitä, että se on saanut laillisia varoituksia. Yritys sisällyttää mallikoulutukseensa myös Instagramin ja Facebookin sisältöä, mikä vaikeuttaa käyttäjien kieltäytymistä. Meta on kohtaamassa useita oikeudenkäyntejä, mukaan lukien yksi kirjoittajilta, kuten Sarah Silvermanilta, jotka väittävät, että yritys on käyttänyt tekijänoikeudella suojattua materiaalia ilman lupaa.

Tärkeä näkökohta on ohjelmointi, koska Llama voi tuottaa bugista tai vaarallista koodia. On erittäin tärkeää, että kehittäjät saavat ihmisen asiantuntijan tarkistamaan kaikki tekoälyn luomat koodit ennen sen käyttöönottoa sovelluksissaan.

Vaikka Metan Llama-malli tarjoaa huomattavaa joustavuutta ja mahdollisuuksia kehittäjille, on tärkeää tunnistaa siihen liittyvät mahdolliset riskit ja rajoitukset.

–

Tuo sinulle Code Labs Academy – Johtavasi Online Coding Bootcamp Future Tech Innovators.