17. září 2024
Meta, stejně jako mnoho dalších předních technologických společností, vyvinula svůj vlastní generativní model umělé inteligence známý jako Llama. To, co odlišuje Llamu, je její otevřenost, která umožňuje vývojářům ji stahovat a používat se značnou svobodou, i když je třeba mít na paměti určité podmínky. Tento přístup kontrastuje s modely jako Claude od Anthropic, OpenAI GPT-4o (motor stojící za ChatGPT) a Gemini společnosti Google, které jsou dostupné výhradně prostřednictvím rozhraní API.
Aby vývojáři měli větší flexibilitu, navázala společnost Meta partnerství s poskytovateli cloudových služeb, jako jsou AWS, Google Cloud a Microsoft Azure, aby nabídli cloudové verze Llama. Meta navíc vytvořila nástroje, které vývojářům zjednodušují proces dolaďování a přizpůsobení modelu tak, aby vyhovoval jejich specifickým požadavkům.
Níže je podrobný popis Llamy, včetně toho, co umí, různé verze, které nabízí, a jak ji můžete efektivně používat.
Co je lama?
Lama není jen jeden model; zahrnuje řadu modelů, např.
-
Lama 8B
-
Lama 70B
-
Lama 405B
Nejnovější verze (Llama 3.1 8B, Llama 3.1 70B a Llama 3.1 405B) byly vydány v červenci 2024. Tyto modely jsou trénovány na široké škále zdrojů dat, jako jsou webové stránky v různých jazycích, veřejný kód, soubory dostupné online a syntetická data vytvořená jinými systémy umělé inteligence.
Llama 3.1 8B a 70B jsou kompaktní modely, které mohou provozovat různá zařízení od notebooků po servery. Na druhé straně Llama 3.1 405B je model ve velkém měřítku, který obvykle vyžaduje hardware datového centra. I když menší modely nemusí být tak výkonné jako 405B, nabízejí vyšší výkon a jsou optimalizovány pro snížení úložiště a latence.
Všechny modely Llama mají kontextové okno se 128 000 tokeny, které jim umožňuje zpracovat přibližně 100 000 slov (nebo 300 stránek textu). To je zhruba délka knih jako Bouřlivé výšiny nebo Harry Potter a vězeň z Azkabanu. Dlouhé kontextové okno pomáhá modelu uchovávat informace z posledních dokumentů a dat, čímž se snižuje riziko, že se odchýlí od tématu.
Co umí lama?
Stejně jako jiné generativní modely umělé inteligence může Llama pomoci s řadou úkolů, jako je kódování, odpovídání na jednoduché matematické otázky a shrnutí dokumentů v osmi jazycích: angličtině, němčině, francouzštině, italštině, portugalštině, hindštině, španělštině a thajštině. Zvládne většinu textových úloh, jako je analýza souborů, jako jsou soubory PDF a tabulky, ale v současné době nemá schopnost generovat nebo zpracovávat obrázky – něco, co by se mohlo v budoucnu změnit.
Modely Llama lze integrovat s aplikacemi, nástroji a rozhraními API třetích stran a provádět různé úkoly. Jsou nakonfigurovány pro použití Brave Search k zodpovězení otázek o aktuálních událostech, Wolfram Alpha API pro matematické a vědecké dotazy a Python interpret pro validaci kódu. Podle Meta může Llama 3.1 dokonce používat některé nástroje, na které nebyla výslovně vyškolena, ačkoli spolehlivost této funkce je stále nejistá.
Kde můžete použít lamu?
Pokud se chcete spojit přímo s Llamou, je funkce chatbota Meta AI podporována na platformách jako Facebook Messenger, WhatsApp, Instagram, Oculus a Meta.ai.
Pro vývojáře je Llama k dispozici ke stažení a lze ji škálovat na několik populárních cloudových platforem. Meta spolupracuje s více než 25 společnostmi, aby hostila Llamu, včetně Nvidia, Databricks, Groq, Dell a Snowflake. Mnoho z těchto partnerů poskytuje další nástroje, které Llamě umožňují přístup k proprietárním datům nebo efektivnější provoz.
Meta navrhuje používat menší modely Llama, konkrétně 8B a 70B, pro obecné účely, jako je spouštění chatbotů nebo vytváření kódu. Na druhou stranu je větší Llama 405B vhodnější pro úkoly, jako je modelová destilace, která zahrnuje přenos znalostí z většího modelu na menší, stejně jako generování syntetických dat pro trénování jiných modelů.
Vývojáři provozující aplikace s více než 700 miliony uživatelů měsíčně musí získat speciální licenci od společnosti Meta pro přístup k Llamě, která bude udělena podle uvážení společnosti Meta.
Jaké nástroje nabízí Meta pro lamu?
Meta zavedla několik nástrojů pro zlepšení zabezpečení Llamy:
-
Llama Guard: Rámec pro moderování, který identifikuje problematický obsah, jako jsou projevy nenávisti, sebepoškozování a porušování autorských práv.
-
Prompt Guard: Nástroj speciálně navržený k ochraně Llama před škodlivými zprávami, které se snaží obejít jeho bezpečnostní opatření.
-
CyberSecEval: Sada pro hodnocení rizik kybernetické bezpečnosti, která vyhodnocuje zabezpečení modelu se zaměřením na hrozby, jako je automatizované sociální inženýrství a útočné kybernetické aktivity.
Například Llama Guard dokáže detekovat škodlivý nebo nelegální obsah, který je zadán nebo generován do Llama, což umožňuje vývojářům přizpůsobit, které kategorie jsou blokovány. Prompt Guard se zaměřuje na obranu proti „útokům injekce zpráv“, které se pokoušejí manipulovat s modelem. CyberSecEval nabízí benchmarky pro hodnocení bezpečnostních rizik spojených s modely Llama.
Lamova omezení
Llama, stejně jako ostatní generativní modely umělé inteligence, má svá omezení a potenciální rizika. Jedním z hlavních problémů je, zda Meta použila materiály chráněné autorskými právy k výcviku lámy. V takovém případě by uživatelé mohli nést odpovědnost za jakýkoli obsah chráněný autorským právem, který model generuje.
Nedávné zprávy naznačují, že Meta používá e-knihy chráněné autorským právem pro školení AI, přestože obdržela právní varování. Společnost také do svých modelových školení začleňuje obsah z Instagramu a Facebooku, takže je pro uživatele obtížné se odhlásit. Meta čelí několika žalobám, včetně jednoho od autorů, jako je Sarah Silverman, kteří tvrdí, že společnost použila materiál chráněný autorskými právy bez povolení.
Důležitým aspektem je programování, protože Llama by mohla produkovat chybný nebo nebezpečný kód. Je důležité, aby vývojáři měli k dispozici odborníka, který zkontroloval jakýkoli kód vygenerovaný umělou inteligencí, než jej implementuje do svých aplikací.
I když model Llama od společnosti Meta nabízí značnou flexibilitu a příležitosti pro vývojáře, je důležité rozpoznat potenciální rizika a omezení, která s tím přicházejí.
–
Přináší vám Akademie Code Labs – váš vedoucí Online Coding Bootcamp pro Future Tech Innovators.