Apa itu Meta Llama? Tinjauan Komprehensif Model AI Terbuka untuk Pengembang

Diperbarui pada September 17, 2024 5 Menit Baca

17 September 2024

Meta, seperti banyak perusahaan teknologi terkemuka lainnya, telah mengembangkan model AI generatifnya sendiri yang dikenal sebagai Llama. Apa yang membedakan Llama adalah sifatnya yang terbuka, memungkinkan pengembang untuk mengunduh dan menggunakannya dengan kebebasan yang besar, meskipun ada beberapa kondisi yang perlu diingat. Pendekatan ini kontras dengan model seperti Claude Anthropic, GPT-4o OpenAI (mesin di belakang ChatGPT), dan Gemini dari Google, yang hanya tersedia melalui API.

Untuk memberikan lebih banyak fleksibilitas kepada pengembang, Meta telah bermitra dengan penyedia layanan cloud seperti AWS, Google Cloud, dan Microsoft Azure untuk menawarkan versi Llama yang dihosting di cloud. Selain itu, Meta telah membangun alat yang menyederhanakan proses bagi pengembang untuk menyempurnakan dan mengadaptasi model untuk memenuhi kebutuhan spesifik mereka.

Di bawah ini adalah penjelasan rinci tentang Llama, termasuk apa yang dapat dilakukannya, berbagai versi yang ditawarkannya, dan bagaimana Anda dapat menggunakannya secara efektif.

Apa itu Llama?

Llama bukan hanya satu model; itu mencakup berbagai model, seperti:

Lama 8B
Lama 70B
Lama 405B

Versi terbaru (Llama 3.1 8B, Llama 3.1 70B, dan Llama 3.1 405B) dirilis pada Juli 2024. Model ini dilatih pada berbagai sumber data, seperti halaman web dalam berbagai bahasa, kode publik, file yang tersedia online, dan data sintetis yang dihasilkan oleh sistem AI lainnya.

Llama 3.1 8B dan 70B adalah model ringkas yang dapat menjalankan berbagai perangkat mulai dari laptop hingga server. Llama 3.1 405B, di sisi lain, adalah model berskala besar yang biasanya memerlukan perangkat keras pusat data. Meskipun model yang lebih kecil mungkin tidak sekuat 405B, model ini menawarkan kinerja yang lebih cepat dan dioptimalkan untuk mengurangi penyimpanan dan latensi.

Semua model Llama menampilkan jendela konteks 128.000 token, memungkinkan model tersebut menangani sekitar 100.000 kata (atau 300 halaman teks). Ini kira-kira panjangnya buku seperti Wuthering Heights atau Harry Potter dan Tahanan Azkaban. Jendela konteks yang panjang membantu model menyimpan informasi dari dokumen dan data terkini, sehingga mengurangi risiko keluar dari topik.

Apa yang Dapat Dilakukan Llama?

Seperti model AI generatif lainnya, Llama dapat membantu berbagai tugas, seperti coding, menjawab pertanyaan matematika sederhana, dan merangkum dokumen dalam delapan bahasa: Inggris, Jerman, Prancis, Italia, Portugis, Hindi, Spanyol, dan Thailand. Ia dapat menangani sebagian besar tugas berbasis teks, seperti menganalisis file seperti PDF dan spreadsheet, namun saat ini ia tidak memiliki kemampuan untuk menghasilkan atau memproses gambar — sesuatu yang dapat berubah di masa mendatang.

Model Llama dapat berintegrasi dengan aplikasi, alat, dan API pihak ketiga untuk melakukan berbagai tugas. Mereka dikonfigurasikan untuk menggunakan Brave Search untuk menjawab pertanyaan tentang peristiwa terkini, Wolfram Alpha API untuk pertanyaan matematika dan sains, dan juru bahasa Python untuk validasi kode. Menurut Meta, Llama 3.1 bahkan dapat menggunakan beberapa alat yang belum dilatih secara eksplisit, meski keandalan fitur ini masih belum pasti.

Dimana Anda Dapat Menggunakan Llama?

Jika Anda ingin terhubung langsung dengan Llama, pengalaman chatbot Meta AI didukung di platform seperti Facebook Messenger, WhatsApp, Instagram, Oculus, dan Meta.ai.

Bagi pengembang, Llama tersedia untuk diunduh dan dapat diperluas ke beberapa platform cloud populer. Meta telah bermitra dengan lebih dari 25 perusahaan untuk menampung Llama, termasuk Nvidia, Databricks, Groq, Dell, dan Snowflake. Banyak dari mitra ini menyediakan alat tambahan yang memungkinkan Llama mengakses data kepemilikan atau berjalan lebih efisien.

Meta menyarankan penggunaan model Llama yang lebih kecil, khususnya 8B dan 70B, untuk tujuan umum seperti menjalankan chatbots atau membuat kode. Di sisi lain, Llama 405B yang lebih besar lebih sesuai untuk tugas-tugas seperti distilasi model, yang melibatkan transfer pengetahuan dari model yang lebih besar ke model yang lebih kecil, serta menghasilkan data sintetis untuk melatih model lainnya.

Pengembang yang mengoperasikan aplikasi dengan lebih dari 700 juta pengguna bulanan harus memperoleh lisensi khusus dari Meta untuk mengakses Llama, dan ini akan diberikan berdasarkan kebijaksanaan Meta.

Alat Apa yang Ditawarkan Meta untuk Llama?

Meta telah memperkenalkan beberapa alat untuk meningkatkan keamanan Llama:

Llama Guard: Kerangka moderasi yang mengidentifikasi konten bermasalah seperti perkataan yang mendorong kebencian, tindakan menyakiti diri sendiri, dan pelanggaran hak cipta.
Prompt Guard: Alat yang dirancang khusus untuk melindungi Llama dari pesan berbahaya yang berupaya mengabaikan tindakan keamanannya.
CyberSecEval: Rangkaian penilaian risiko keamanan siber yang mengevaluasi keamanan model, dengan fokus pada ancaman seperti rekayasa sosial otomatis dan aktivitas siber ofensif.

Misalnya, Llama Guard dapat mendeteksi konten berbahaya atau ilegal yang dimasukkan atau dihasilkan ke dalam Llama, sehingga memungkinkan pengembang menyesuaikan kategori mana yang diblokir. Prompt Guard berfokus pada pertahanan terhadap “serangan injeksi pesan” yang berupaya memanipulasi model. CyberSecEval menawarkan tolok ukur untuk menilai risiko keamanan yang terkait dengan model Llama.

Keterbatasan Llama

Llama, seperti model AI generatif lainnya, memiliki keterbatasan dan potensi risiko. Salah satu kekhawatiran utama adalah apakah Meta menggunakan materi berhak cipta untuk melatih Llama. Jika demikian, pengguna dapat menghadapi tanggung jawab atas konten berhak cipta apa pun yang dihasilkan model tersebut.

Laporan terbaru menunjukkan bahwa Meta telah menggunakan e-book berhak cipta untuk pelatihan AI, meskipun telah menerima peringatan hukum. Perusahaan juga memasukkan konten dari Instagram dan Facebook ke dalam pelatihan modelnya, sehingga menyulitkan pengguna untuk memilih tidak ikut serta. Meta menghadapi banyak tuntutan hukum, termasuk salah satu dari penulis seperti Sarah Silverman, yang mengklaim bahwa perusahaan tersebut telah menggunakan materi berhak cipta tanpa izin.

Pertimbangan penting adalah pemrograman, karena Llama dapat menghasilkan kode yang bermasalah atau tidak aman. Sangat penting bagi pengembang untuk memiliki manusia ahli yang meninjau kode apa pun yang dihasilkan AI sebelum menerapkannya dalam aplikasi mereka.

Meskipun model Llama Meta menawarkan fleksibilitas dan peluang yang besar bagi pengembang, penting untuk mengenali potensi risiko dan keterbatasan yang menyertainya.

–

Dipersembahkan oleh Code Labs Academy – Unggulan Anda Online Coding Bootcamp untuk Inovator Teknologi Masa Depan.