¿Qué es Meta Llama? Una mirada completa al modelo abierto de IA para desarrolladores

Actualizado en September 17, 2024 5 minutos leer

17 de septiembre de 2024

Meta, como muchas otras empresas tecnológicas líderes, ha desarrollado su propio modelo de IA generativa conocido como Llama. Lo que distingue a Llama es su naturaleza abierta, lo que permite a los desarrolladores descargarlo y utilizarlo con considerable libertad, aunque hay algunas condiciones a tener en cuenta. Este enfoque contrasta con modelos como Claude de Anthropic, GPT-4o de OpenAI (el motor detrás de ChatGPT) y Gemini de Google, que están disponibles únicamente a través de API.

Para brindar a los desarrolladores más flexibilidad, Meta se ha asociado con proveedores de servicios en la nube como AWS, Google Cloud y Microsoft Azure para ofrecer versiones de Llama alojadas en la nube. Además, Meta ha creado herramientas que simplifican el proceso para que los desarrolladores ajusten y adapten el modelo para cumplir con sus requisitos específicos.

A continuación se muestra una descripción detallada de Llama, incluido lo que puede hacer, las diferentes versiones que ofrece y cómo puede utilizarla de forma eficaz.

¿Qué es Llama?

Llama no es simplemente un modelo; Abarca una gama de modelos, tales como:

-Llama 8B

-Llama 70B

-Llama 405B

Las versiones más recientes (Llama 3.1 8B, Llama 3.1 70B y Llama 3.1 405B) se lanzaron en julio de 2024. Estos modelos se entrenan en una amplia gama de fuentes de datos, como páginas web en diferentes idiomas, código público y archivos disponibles en línea. y datos sintéticos producidos por otros sistemas de IA.

Llama 3.1 8B y 70B son modelos compactos que pueden ejecutar una variedad de dispositivos, desde computadoras portátiles hasta servidores. El Llama 3.1 405B, por otro lado, es un modelo a gran escala que normalmente requiere hardware de centro de datos. Si bien los modelos más pequeños pueden no ser tan potentes como el 405B, ofrecen un rendimiento más rápido y están optimizados para reducir el almacenamiento y la latencia.

Todos los modelos Llama cuentan con una ventana de contexto de 128.000 tokens, lo que les permite manejar alrededor de 100.000 palabras (o 300 páginas de texto). Esta es aproximadamente la longitud de libros como Cumbres borrascosas o Harry Potter y el prisionero de Azkaban. Una ventana de contexto larga ayuda al modelo a retener información de documentos y datos recientes, lo que reduce el riesgo de desviarse del tema.

¿Qué puede hacer la llama?

Al igual que otros modelos de IA generativa, Llama puede ayudar con una variedad de tareas, como codificar, responder preguntas matemáticas simples y resumir documentos en ocho idiomas: inglés, alemán, francés, italiano, portugués, hindi, español y tailandés. Puede manejar la mayoría de las tareas basadas en texto, como analizar archivos como PDF y hojas de cálculo, pero actualmente no tiene la capacidad de generar o procesar imágenes, algo que podría cambiar en el futuro.

Los modelos de Llama pueden integrarse con aplicaciones, herramientas y API de terceros para realizar una variedad de tareas. Están configurados para utilizar Brave Search para responder preguntas sobre eventos actuales, la API Wolfram Alpha para consultas de matemáticas y ciencias y un intérprete de Python para la validación de código. Según Meta, Llama 3.1 puede incluso utilizar algunas herramientas para las que no ha sido entrenado explícitamente, aunque la confiabilidad de esta característica aún es incierta.

¿Dónde puedes usar Llama?

Si desea conectarse directamente con Llama, la experiencia del chatbot Meta AI es compatible con plataformas como Facebook Messenger, WhatsApp, Instagram, Oculus y Meta.ai.

Para los desarrolladores, Llama está disponible para descargar y puede ampliarse a varias plataformas de nube populares. Meta se ha asociado con más de 25 empresas para alojar Llama, incluidas Nvidia, Databricks, Groq, Dell y Snowflake. Muchos de estos socios proporcionan herramientas adicionales que permiten a Llama acceder a datos patentados o ejecutarse de manera más eficiente.

Meta sugiere utilizar los modelos Llama más pequeños, específicamente el 8B y el 70B, para fines generales como ejecutar chatbots o crear código. Por otro lado, el Llama 405B más grande es más apropiado para tareas como la destilación de modelos, que implica transferir conocimiento de un modelo más grande a uno más pequeño, así como generar datos sintéticos para entrenar otros modelos.

Los desarrolladores que operan aplicaciones con más de 700 millones de usuarios mensuales deben adquirir una licencia especial de Meta para acceder a Llama, y esto se otorgará a discreción de Meta.

¿Qué herramientas ofrece Meta para Llama?

Meta ha introducido varias herramientas para mejorar la seguridad de Llama:

Llama Guard: Un marco de moderación que identifica contenido problemático, como incitación al odio, autolesiones e infracción de derechos de autor.
Prompt Guard: Una herramienta diseñada específicamente para proteger a Llama de mensajes dañinos que buscan eludir sus medidas de seguridad.
CyberSecEval: Un conjunto de evaluación de riesgos de ciberseguridad que evalúa la seguridad del modelo, enfocándose en amenazas como la ingeniería social automatizada y las actividades cibernéticas ofensivas.

Por ejemplo, Llama Guard puede detectar contenido dañino o ilegal que se ingresa o genera en Llama, lo que permite a los desarrolladores personalizar qué categorías están bloqueadas. Prompt Guard se centra en la defensa contra “ataques de inyección de mensajes” que intentan manipular el modelo. CyberSecEval ofrece puntos de referencia para evaluar los riesgos de seguridad asociados con los modelos Llama.

Limitaciones de la llama

Llama, al igual que otros modelos de IA generativa, tiene sus limitaciones y riesgos potenciales. Una de las principales preocupaciones es si Meta utilizó materiales con derechos de autor para entrenar a Llama. Si ese es el caso, los usuarios podrían enfrentar responsabilidad por cualquier contenido protegido por derechos de autor que genere el modelo.

Informes recientes indican que Meta ha estado utilizando libros electrónicos con derechos de autor para el entrenamiento de IA, a pesar de haber recibido advertencias legales. La compañía también incorpora contenido de Instagram y Facebook en su modelo de capacitación, lo que dificulta que los usuarios opten por no participar. Meta se enfrenta a múltiples demandas, incluida una de autores como Sarah Silverman, que afirman que la empresa ha utilizado material protegido por derechos de autor sin permiso.

Una consideración importante es la programación, ya que Llama podría producir código con errores o inseguro. Es fundamental que los desarrolladores cuenten con un experto humano que revise cualquier código generado por IA antes de implementarlo en sus aplicaciones.

Si bien el modelo Llama de Meta ofrece considerable flexibilidad y oportunidades para los desarrolladores, es importante reconocer los riesgos y limitaciones potenciales que conlleva.

–

Presentado por Code Labs Academy - Your Leading Campo de entrenamiento de codificación en línea para futuros innovadores tecnológicos.