17 de setembro de 2024
A Meta, como muitas outras empresas líderes de tecnologia, desenvolveu seu próprio modelo generativo de IA conhecido como Llama. O que diferencia o Llama é a sua natureza aberta, permitindo aos desenvolvedores baixá-lo e usá-lo com considerável liberdade, embora haja algumas condições a serem lembradas. Essa abordagem contrasta com modelos como Claude da Anthropic, GPT-4o da OpenAI (o mecanismo por trás do ChatGPT) e Gemini do Google, que estão disponíveis exclusivamente por meio de APIs.
Para dar aos desenvolvedores mais flexibilidade, a Meta fez parceria com provedores de serviços em nuvem, como AWS, Google Cloud e Microsoft Azure, para oferecer versões do Llama hospedadas na nuvem. Além disso, a Meta construiu ferramentas que simplificam o processo para os desenvolvedores ajustarem e adaptarem o modelo para atender aos seus requisitos específicos.
Abaixo está uma descrição detalhada do Llama, incluindo o que ele pode fazer, as diferentes versões que oferece e como você pode usá-lo de forma eficaz.
O que é Lhama?
Llama não é apenas um modelo; abrange uma gama de modelos, como:
-
Lhama 8B
-
Lhama 70B
-
Lhama 405B
As versões mais recentes (Llama 3.1 8B, Llama 3.1 70B e Llama 3.1 405B) foram lançadas em julho de 2024. Esses modelos são treinados em uma ampla variedade de fontes de dados, como páginas da web em diferentes idiomas, código público, arquivos disponíveis online e dados sintéticos produzidos por outros sistemas de IA.
O Llama 3.1 8B e 70B são modelos compactos que podem executar uma variedade de dispositivos, de laptops a servidores. O Llama 3.1 405B, por outro lado, é um modelo em grande escala que normalmente requer hardware de data center. Embora os modelos menores possam não ser tão potentes quanto o 405B, eles oferecem desempenho mais rápido e são otimizados para armazenamento e latência reduzidos.
Todos os modelos Llama apresentam uma janela de contexto de 128.000 tokens, permitindo lidar com cerca de 100.000 palavras (ou 300 páginas de texto). Essa é aproximadamente a extensão de livros como O Morro dos Ventos Uivantes ou Harry Potter e o Prisioneiro de Azkaban. Uma longa janela de contexto ajuda o modelo a reter informações de documentos e dados recentes, reduzindo o risco de desvio do assunto.
O que o lama pode fazer?
Como outros modelos generativos de IA, o Llama pode ajudar em diversas tarefas, como codificação, resposta a questões matemáticas simples e resumo de documentos em oito idiomas: inglês, alemão, francês, italiano, português, hindi, espanhol e tailandês. Ele pode lidar com a maioria das tarefas baseadas em texto, como análise de arquivos como PDFs e planilhas, mas atualmente não tem a capacidade de gerar ou processar imagens – algo que pode mudar no futuro.
Os modelos Llama podem ser integrados a aplicativos, ferramentas e APIs de terceiros para executar uma variedade de tarefas. Eles são configurados para usar o Brave Search para responder perguntas sobre eventos atuais, a API Wolfram Alpha para consultas matemáticas e científicas e um interpretador Python para validação de código. De acordo com Meta, o Llama 3.1 pode até usar algumas ferramentas nas quais não foi explicitamente treinado, embora a confiabilidade desse recurso ainda seja incerta.
Onde você pode usar o lama?
Se você deseja se conectar diretamente com o Llama, a experiência do chatbot Meta AI é compatível com plataformas como Facebook Messenger, WhatsApp, Instagram, Oculus e Meta.ai.
Para desenvolvedores, o Llama está disponível para download e pode ser dimensionado para diversas plataformas de nuvem populares. A Meta fez parceria com mais de 25 empresas para hospedar o Llama, incluindo Nvidia, Databricks, Groq, Dell e Snowflake. Muitos desses parceiros fornecem ferramentas adicionais que permitem ao Llama acessar dados proprietários ou operar com mais eficiência.
Meta sugere o uso dos modelos Llama menores, especificamente o 8B e o 70B, para fins gerais, como executar chatbots ou criar código. Por outro lado, o Llama 405B maior é mais apropriado para tarefas como destilação de modelos, que envolve a transferência de conhecimento de um modelo maior para um menor, além de gerar dados sintéticos para treinar outros modelos.
Os desenvolvedores que operam aplicativos com mais de 700 milhões de usuários mensais devem adquirir uma licença especial da Meta para acessar o Llama, e isso será concedido a critério da Meta.
Quais ferramentas o Meta oferece para o Llama?
Meta introduziu várias ferramentas para melhorar a segurança do Llama:
-
Llama Guard: uma estrutura de moderação que identifica conteúdo problemático, como discurso de ódio, automutilação e violação de direitos autorais.
-
Prompt Guard: Uma ferramenta projetada especificamente para proteger o Llama de mensagens prejudiciais que procuram contornar suas medidas de segurança.
-
CyberSecEval: Um conjunto de avaliação de riscos de segurança cibernética que avalia a segurança do modelo, com foco em ameaças como engenharia social automatizada e atividades cibernéticas ofensivas.
Por exemplo, o Llama Guard pode detectar conteúdo prejudicial ou ilegal inserido ou gerado no Llama, permitindo que os desenvolvedores personalizem quais categorias serão bloqueadas. O Prompt Guard se concentra na defesa contra “ataques de injeção de mensagens” que tentam manipular o modelo. CyberSecEval oferece benchmarks para avaliar riscos de segurança associados aos modelos Llama.
Limitações da Lhama
O Llama, como outros modelos generativos de IA, tem suas limitações e riscos potenciais. Uma das principais preocupações é se Meta usou materiais protegidos por direitos autorais para treinar Llama. Se for esse o caso, os usuários poderão ser responsabilizados por qualquer conteúdo protegido por direitos autorais gerado pelo modelo.
Relatórios recentes indicam que a Meta tem usado e-books protegidos por direitos autorais para treinamento em IA, apesar de ter recebido advertências legais. A empresa também incorpora conteúdo do Instagram e do Facebook em seu treinamento de modelo, dificultando a desativação dos usuários. A Meta enfrenta vários processos judiciais, incluindo um de autores como Sarah Silverman, que afirmam que a empresa usou material protegido por direitos autorais sem permissão.
Uma consideração importante é a programação, pois o Llama pode produzir código com erros ou inseguro. É fundamental que os desenvolvedores tenham um especialista humano para revisar qualquer código gerado por IA antes de implementá-lo em seus aplicativos.
Embora o modelo Llama da Meta ofereça flexibilidade e oportunidades consideráveis para os desenvolvedores, é importante reconhecer os riscos e limitações potenciais que o acompanham.
–
Trazido a você pela Code Labs Academy – seu líder Online Coding Bootcamp para futuros inovadores tecnológicos.