Que é Meta Llama? Unha mirada completa ao modelo de IA aberta para desenvolvedores

Actualizado en September 23, 2024 5 Minutos lidos

17 de setembro de 2024

Meta, como moitas outras empresas tecnolóxicas líderes, desenvolveu o seu propio modelo de IA xerativa coñecido como Llama. O que distingue a Llama é a súa natureza aberta, que permite aos desenvolvedores descargalo e usalo con considerable liberdade, aínda que hai que ter en conta algunhas condicións. Este enfoque contrasta con modelos como Claude de Anthropic, GPT-4o de OpenAI (o motor detrás de ChatGPT) e Gemini de Google, que están dispoñibles só a través de API.

Para ofrecerlles aos desenvolvedores máis flexibilidade, Meta asociouse con provedores de servizos na nube como AWS, Google Cloud e Microsoft Azure para ofrecer versións de Llama aloxadas na nube. Ademais, Meta creou ferramentas que simplifican o proceso para que os desenvolvedores axusten e adapten o modelo para satisfacer os seus requisitos específicos.

A continuación móstrase unha descrición detallada de Llama, incluíndo o que pode facer, as diferentes versións que ofrece e como pode usalo de forma eficaz.

Que é Llama?

A chama non é só un modelo; abarca unha variedade de modelos, como:

Chama 8B
Chama 70B
Chama 405B

As versións máis recentes (Llama 3.1 8B, Llama 3.1 70B e Llama 3.1 405B) publicáronse en xullo de 2024. Estes modelos están adestrados nunha ampla gama de fontes de datos, como páxinas web en diferentes idiomas, código público, ficheiros dispoñibles en liña., e datos sintéticos producidos por outros sistemas de IA.

Os Llama 3.1 8B e 70B son modelos compactos que poden executar unha variedade de dispositivos, desde portátiles ata servidores. O Llama 3.1 405B, por outra banda, é un modelo a gran escala que normalmente require hardware do centro de datos. Aínda que os modelos máis pequenos poden non ser tan potentes como o 405B, ofrecen un rendemento máis rápido e están optimizados para reducir o almacenamento e a latencia.

Todos os modelos Llama teñen unha ventá de contexto de 128.000 fichas, o que lles permite manexar unhas 100.000 palabras (ou 300 páxinas de texto). Esta é aproximadamente a lonxitude de libros como Cumes Borrascosas ou Harry Potter e o prisioneiro de Azkaban. Unha ventá de contexto longa axuda ao modelo a reter información dos documentos e datos recentes, reducindo o risco de desviarse do tema.

Que pode facer a chama?

Do mesmo xeito que outros modelos de IA xerativa, Llama pode axudar con unha variedade de tarefas, como codificar, responder preguntas matemáticas sinxelas e resumir documentos en oito idiomas: inglés, alemán, francés, italiano, portugués, hindi, español e tailandés. Pode xestionar a maioría das tarefas baseadas en texto, como a análise de ficheiros como PDF e follas de cálculo, pero actualmente non ten a capacidade de xerar ou procesar imaxes, algo que podería cambiar no futuro.

Os modelos Llama poden integrarse con aplicacións, ferramentas e API de terceiros para realizar unha variedade de tarefas. Están configurados para usar Brave Search para responder preguntas sobre eventos actuais, a API Wolfram Alpha para consultas de matemáticas e ciencias e un intérprete de Python para a validación de código. Segundo Meta, Llama 3.1 pode incluso usar algunhas ferramentas nas que non foi adestrado explícitamente, aínda que a fiabilidade desta función aínda é incerta.

Onde podes usar a chama?

Se queres conectarte directamente con Llama, a experiencia de chatbot Meta AI é compatible con plataformas como Facebook Messenger, WhatsApp, Instagram, Oculus e Meta.ai.

Para os desenvolvedores, Llama está dispoñible para descargar e pódese escalar a varias plataformas de nube populares. Meta asociouse con máis de 25 empresas para aloxar a Llama, incluíndo Nvidia, Databricks, Groq, Dell e Snowflake. Moitos destes socios proporcionan ferramentas adicionais que permiten que Llama acceda a datos propietarios ou funcione de forma máis eficiente.

Meta suxire usar os modelos Llama máis pequenos, concretamente os 8B e 70B, para fins xerais, como executar chatbots ou crear código. Por outra banda, a Llama 405B máis grande é máis adecuada para tarefas como a destilación de modelos, que implica transferir coñecementos dun modelo maior a outro máis pequeno, así como xerar datos sintéticos para adestrar outros modelos.

Os desenvolvedores que operan aplicacións con máis de 700 millóns de usuarios mensuais deben adquirir unha licenza especial de Meta para acceder a Llama, e esta concederase a criterio de Meta.

Que ferramentas ofrece Meta para Llama?

Meta introduciu varias ferramentas para mellorar a seguridade de Llama:

Guardia de chamas: un marco de moderación que identifica contido problemático como o discurso de odio, a autolesión e a infracción dos dereitos de autor.
Prompt Guard: Unha ferramenta deseñada especificamente para protexer a Llama de mensaxes daniñas que buscan evitar as súas medidas de seguridade.
CyberSecEval: Unha suite de avaliación de riscos de ciberseguridade que avalía a seguridade do modelo, centrándose en ameazas como a enxeñería social automatizada e as actividades cibernéticas ofensivas.

Por exemplo, Llama Guard pode detectar contido prexudicial ou ilegal que se introduce ou xera en Llama, o que permite aos desenvolvedores personalizar as categorías que se bloquean. Prompt Guard céntrase na defensa dos “ataques de inxección de mensaxes” que tentan manipular o modelo. CyberSecEval ofrece puntos de referencia para avaliar os riscos de seguridade asociados aos modelos Llama.

Limitacións da chama

A chama, como outros modelos de IA xerativa, ten as súas limitacións e riscos potenciais. Unha das principais preocupacións é se Meta utilizou materiais con copyright para adestrar a Llama. Se ese é o caso, os usuarios poderían enfrontarse a responsabilidade por calquera contido protexido por dereitos de autor que xere o modelo.

Informes recentes indican que Meta estivo a usar libros electrónicos protexidos por copyright para adestramento en IA, a pesar de recibir avisos legais. A compañía tamén incorpora contido de Instagram e Facebook na súa formación de modelos, o que dificulta que os usuarios poidan desactivarse. Meta enfróntase a varias demandas, entre elas unha de autores como Sarah Silverman, que afirman que a compañía usou material protexido por dereitos de autor sen permiso.

Unha consideración importante é a programación, xa que Llama podería producir código con erros ou inseguros. É fundamental que os desenvolvedores fagan que un experto humano revise calquera código xerado pola IA antes de implementalo nas súas aplicacións.

Aínda que o modelo Llama de Meta ofrece unha flexibilidade e oportunidades considerables para os desenvolvedores, é importante recoñecer os posibles riscos e limitacións que conllevan.

–

Presentado por Code Labs Academy - Your Leading Online Coding Bootcamp para futuros innovadores tecnolóxicos.