メタ・ラマとは何ですか？開発者向けのオープン AI モデルの包括的な考察

September 17, 2024に更新 2議事録を読みます

2024 年 9 月 17 日

Meta は、他の多くの大手テクノロジー企業と同様に、Llama として知られる独自の生成 AI モデルを開発しました。 Llama の特徴はそのオープンな性質であり、開発者はかなり自由にダウンロードして使用できますが、留意すべき条件がいくつかあります。このアプローチは、Anthropic の Claude や OpenAI の GPT-4o (ChatGPT などのモデルとは対照的です)。 Fingertips-chatgpt-app-now-available-for-mac-2024-07-02))、および Google の Gemini は API を通じてのみ利用可能です。

開発者にさらなる柔軟性を提供するために、Meta は AWS、Google Cloud、Microsoft Azure などのクラウドサービスプロバイダーと提携して、Llama のクラウドホスト型バージョンを提供しています。さらに、Meta は、開発者が特定の要件を満たすようにモデルを微調整および適応させるプロセスを簡素化するツールを構築しました。

以下に、Llama の機能、提供されるさまざまなバージョン、効果的な使用方法など、Llama について詳しく説明します。

ラマとは何ですか?

ラマは単なる 1 つのモデルではありません。これには、次のようなさまざまなモデルが含まれます。

ラマ 8B
ラマ 70B
ラマ 405B

最新バージョン (Llama 3.1 8B、Llama 3.1 70B、Llama 3.1 405B) は 2024 年 7 月にリリースされました。これらのモデルは、さまざまな言語の Web ページ、公開コード、オンラインで入手可能なファイルなど、幅広いデータソースでトレーニングされています。、および他の AI システムによって生成された合成データ。

Llama 3.1 8B および 70B は、ラップトップからサーバーまでさまざまなデバイスを実行できるコンパクトなモデルです。一方、Llama 3.1 405B は、通常、データセンターのハードウェアを必要とする大規模モデルです。小型モデルは 405B ほど強力ではないかもしれませんが、より高速なパフォーマンスを提供し、ストレージと遅延を削減するために最適化されています。

すべての Llama モデルは 128,000 トークンのコンテキストウィンドウを備えており、約 100,000 単語 (または 300 ページのテキスト) を処理できます。これは、『嵐が丘』や『ハリー・ポッターとアズカバンの囚人』などの本とほぼ同じ長さです。コンテキストウィンドウが長いと、モデルが最近のドキュメントやデータからの情報を保持し、トピックから逸れるリスクが軽減されます。

ラマは何ができるの?

他の生成 AI モデルと同様に、Llama は、コーディング、簡単な数学の質問への回答、英語、ドイツ語、フランス語、イタリア語、ポルトガル語、ヒンディー語、スペイン語、タイ語の 8 つの言語での文書の要約など、さまざまなタスクを支援できます。 PDF やスプレッドシートなどのファイルの分析など、ほとんどのテキストベースのタスクを処理できますが、現時点では画像を生成または処理する機能はありません。これは将来変更される可能性があります。

Llama モデルは、サードパーティのアプリ、ツール、API と統合して、さまざまなタスクを実行できます。現在の出来事に関する質問に答えるために Brave Search を使用し、数学と科学のクエリには Wolfram Alpha API を、コード検証には Python インタプリタを使用するように構成されています。 Meta 氏によると、Llama 3.1 は明示的にトレーニングされていない一部のツールも使用できますが、この機能の信頼性はまだ不明です。

ラマはどこで使用できますか?

Llama に直接接続したい場合、Meta AI チャットボットエクスペリエンスは Facebook Messenger、WhatsApp、Instagram、Oculus、Meta.ai などのプラットフォームでサポートされています。

開発者向けに Llama をダウンロードでき、いくつかの一般的なクラウドプラットフォームに拡張できます。 Meta は、Nvidia、Databricks、Groq、Dell、Snowflake を含む 25 社以上の企業と提携して Llama をホストしています。これらのパートナーの多くは、Llama が独自のデータにアクセスしたり、より効率的に実行したりできる追加ツールを提供しています。

Meta は、チャットボットの実行やコードの作成などの一般的な目的には、より小さい Llama モデル、具体的には 8B と 70B を使用することを提案しています。一方、より大型の Llama 405B は、より大きなモデルからより小さなモデルに知識を転送したり、他のモデルをトレーニングするための合成データを生成したりするモデル蒸留などのタスクに適しています。

月間ユーザー数が 7 億人を超えるアプリケーションを運用する開発者は、Llama にアクセスするために Meta から特別なライセンスを取得する必要があり、これは Meta の裁量で付与されます。

Meta は Llama にどのようなツールを提供しますか?

Meta は、Llama のセキュリティを向上させるためにいくつかのツールを導入しました。

Llama Guard: ヘイトスピーチ、自傷行為、著作権侵害などの問題のあるコンテンツを特定するモデレーションフレームワーク。
プロンプトガード: セキュリティ対策を回避しようとする有害なメッセージから Llama を保護するために特別に設計されたツール。
CyberSecEval: 自動化されたソーシャルエンジニアリングや攻撃的なサイバー活動などの脅威に焦点を当てて、モデルセキュリティを評価するサイバーセキュリティリスク評価スイート。

たとえば、Llama Guard は、Llama に入力または生成される有害なコンテンツまたは違法なコンテンツを検出できるため、開発者はどのカテゴリをブロックするかをカスタマイズできます。 Prompt Guard は、モデルを操作しようとする「メッセージインジェクション攻撃」に対する防御に重点を置いています。 CyberSecEval は、Llama モデルに関連するセキュリティリスクを評価するためのベンチマークを提供します。

ラマの限界

Llama には、他の生成 AI モデルと同様に、限界と潜在的なリスクがあります。主な懸念の 1 つは、メタがラマを訓練するために著作権で保護された素材を使用したかどうかです。その場合、ユーザーはモデルが生成する著作権で保護されたコンテンツに対して責任を負う可能性があります。

最近の報道によると、メタ社は法的警告を受けていたにもかかわらず、著作権で保護された電子書籍を AI トレーニングに使用していたという。同社はまた、Instagram と Facebook のコンテンツをモデルのトレーニングに組み込んでおり、ユーザーがオプトアウトすることを困難にしています。 Metaは複数の訴訟に直面しているが、その中には同社が著作権で保護された素材を許可なく使用したと主張するサラ・シルバーマン氏などの著者からの訴訟も含まれる。

Llama はバグのあるコードや安全でないコードを生成する可能性があるため、プログラミングについては重要な考慮事項が必要です。開発者は、AI が生成したコードをアプリケーションに実装する前に、人間の専門家にレビューしてもらうことが重要です。

Meta の Llama モデルは開発者にかなりの柔軟性と機会を提供しますが、それに伴う潜在的なリスクと制限を認識することが重要です。

–

Code Labs Academy – Your Leading オンラインコーディングブートキャンプ 将来のテクノロジーイノベーター向け。 が提供します。