메타 라마란 무엇인가요? 개발자를 위한 Open AI 모델에 대한 종합적인 살펴보기

September 17, 2024에서 업데이트 4 분을 읽습니다

2024년 9월 17일

다른 선도적인 기술 기업과 마찬가지로 Meta는 Llama라는 자체 생성 AI 모델을 개발했습니다. Llama를 차별화하는 점은 개방형 특성으로 개발자가 상당히 자유롭게 다운로드하고 사용할 수 있다는 점입니다. 단, 몇 가지 염두에 두어야 할 조건이 있습니다. 이 접근 방식은 Anthropic의 Claude, OpenAI의 GPT-4o(ChatGPT와 같은 모델과 대조됩니다. Fingertips-chatgpt-app-now-available-for-mac-2024-07-02)) 및 Google의 Gemini는 API를 통해서만 사용할 수 있습니다.

개발자에게 더 많은 유연성을 제공하기 위해 Meta는 AWS, Google Cloud 및 Microsoft Azure와 같은 클라우드 서비스 제공업체와 제휴하여 클라우드 호스팅 버전의 Llama를 제공했습니다. 또한 Meta는 개발자가 특정 요구 사항에 맞게 모델을 미세 조정하고 조정할 수 있는 프로세스를 단순화하는 도구를 구축했습니다.

다음은 Llama가 수행할 수 있는 작업, 제공되는 다양한 버전, 효과적으로 사용하는 방법을 포함하여 Llama에 대한 자세한 설명입니다.

라마란 무엇인가요?

라마는 단지 하나의 모델이 아닙니다. 이는 다음과 같은 다양한 모델을 포함합니다.

라마 8B
라마 70B
라마 405B

최신 버전(Llama 3.1 8B, Llama 3.1 70B 및 Llama 3.1 405B)은 2024년 7월에 출시되었습니다. 이러한 모델은 다양한 언어로 된 웹 페이지, 공개 코드, 온라인에서 사용 가능한 파일과 같은 광범위한 데이터 소스에 대해 학습되었습니다., 기타 AI 시스템에서 생성된 합성 데이터.

Llama 3.1 8B 및 70B는 노트북부터 서버까지 다양한 장치를 실행할 수 있는 컴팩트 모델입니다. 반면 Llama 3.1 405B는 일반적으로 데이터 센터 하드웨어가 필요한 대규모 모델입니다. 소형 모델은 405B만큼 강력하지 않을 수 있지만 더 빠른 성능을 제공하고 저장 공간과 대기 시간을 줄이는 데 최적화되어 있습니다.

모든 Llama 모델은 128,000개 토큰의 컨텍스트 창을 갖추고 있어 약 100,000단어(또는 300페이지의 텍스트)를 처리할 수 있습니다. 이것은 대략 Wuthering Heights나 Harry Potter와 Azkaban의 죄수와 같은 책의 길이입니다. 긴 컨텍스트 창은 모델이 최근 문서와 데이터의 정보를 유지하는 데 도움이 되어 주제에서 벗어날 위험을 줄여줍니다.

라마는 무엇을 할 수 있나요?

다른 생성 AI 모델과 마찬가지로 Llama는 영어, 독일어, 프랑스어, 이탈리아어, 포르투갈어, 힌디어, 스페인어, 태국어 등 8개 언어로 코딩, 간단한 수학 질문에 답하기, 문서 요약 등 다양한 작업에 도움을 줄 수 있습니다. PDF 및 스프레드시트와 같은 파일 분석과 같은 대부분의 텍스트 기반 작업을 처리할 수 있지만 현재는 이미지를 생성하거나 처리하는 기능이 없습니다. 이는 향후 변경될 수 있습니다.

Llama 모델은 타사 앱, 도구 및 API와 통합되어 다양한 작업을 수행할 수 있습니다. Brave Search를 사용하여 현재 사건에 대한 질문에 답변하고, Wolfram Alpha API를 통해 수학 및 과학 쿼리를 수행하고, Python 인터프리터를 사용하여 코드 검증을 수행하도록 구성되어 있습니다. Meta에 따르면 Llama 3.1은 명시적으로 교육받지 않은 일부 도구도 사용할 수 있지만 이 기능의 신뢰성은 여전히 불확실합니다.

라마는 어디에 사용할 수 있나요?

Llama와 직접 연결하려는 경우 Facebook Messenger, WhatsApp, Instagram, Oculus 및 Meta.ai와 같은 플랫폼에서 Meta AI 챗봇 경험이 지원됩니다.

개발자의 경우 Llama를 다운로드할 수 있으며 여러 인기 클라우드 플랫폼으로 확장할 수 있습니다. Meta는 Nvidia, Databricks, Groq, Dell 및 Snowflake를 포함하여 Llama를 호스팅하기 위해 25개가 넘는 회사와 파트너십을 맺었습니다. 이러한 파트너 중 다수는 Llama가 독점 데이터에 액세스하거나 보다 효율적으로 실행할 수 있도록 하는 추가 도구를 제공합니다.

Meta는 챗봇 실행이나 코드 생성과 같은 일반적인 목적으로 더 작은 Llama 모델, 특히 8B 및 70B를 사용할 것을 제안합니다. 반면, 더 큰 Llama 405B는 더 큰 모델에서 더 작은 모델로 지식을 전달하고 다른 모델을 훈련하기 위한 합성 데이터를 생성하는 모델 증류와 같은 작업에 더 적합합니다.

월간 사용자 수가 7억 명 이상인 애플리케이션을 운영하는 개발자가 Llama에 액세스하려면 Meta로부터 특별 라이센스를 취득해야 하며 이는 Meta의 재량에 따라 부여됩니다.

Meta는 Llama에 어떤 도구를 제공하나요?

Meta는 Llama의 보안을 향상하기 위해 여러 가지 도구를 도입했습니다.

Prompt Guard: 보안 조치를 우회하려는 유해한 메시지로부터 Llama를 보호하기 위해 특별히 설계된 도구입니다.
CyberSecEval: 자동화된 사회 공학 및 공격적인 사이버 활동과 같은 위협에 중점을 두고 모델 보안을 평가하는 사이버 보안 위험 평가 제품군입니다.

예를 들어 Llama Guard는 Llama에 입력되거나 생성된 유해하거나 불법적인 콘텐츠를 감지하여 개발자가 차단할 카테고리를 사용자 정의할 수 있도록 합니다. Prompt Guard는 모델을 조작하려는 “메시지 주입 공격”을 방어하는 데 중점을 둡니다. CyberSecEval은 Llama 모델과 관련된 보안 위험을 평가하기 위한 벤치마크를 제공합니다.

라마의 한계

최근 보고서에 따르면 Meta는 법적 경고를 받았음에도 불구하고 AI 교육을 위해 저작권이 있는 전자책을 사용해 왔습니다. 또한 회사는 Instagram과 Facebook의 콘텐츠를 모델 교육에 통합하여 사용자가 거부하기 어렵게 만듭니다. Meta는 회사가 저작권이 있는 자료를 허가 없이 사용했다고 주장하는 Sarah Silverman과 같은 작가의 소송을 포함하여 여러 소송에 직면해 있습니다.

Llama는 버그가 있거나 안전하지 않은 코드를 생성할 수 있으므로 중요한 고려 사항은 프로그래밍입니다. 개발자가 AI 생성 코드를 애플리케이션에 구현하기 전에 인간 전문가가 검토하도록 하는 것이 중요합니다.

Meta의 Llama 모델은 개발자에게 상당한 유연성과 기회를 제공하지만 그에 수반되는 잠재적인 위험과 한계를 인식하는 것이 중요합니다.

–

Code Labs Academy에서 제공 – 귀하의 선도 온라인 코딩 부트캠프 미래 기술 혁신가를 위한.