Setyembre 17, 2024
Ang Meta, tulad ng maraming iba pang nangungunang kumpanya ng tech, ay bumuo ng sarili nitong generative AI model na kilala bilang Llama. Ang pinagkaiba ng Llama ay ang pagiging bukas nito, na nagbibigay-daan sa mga developer na i-download at gamitin ito nang may malaking kalayaan, kahit na may ilang kundisyon na dapat tandaan. Ang diskarte na ito ay kaibahan sa mga modelo tulad ng Anthropic's Claude, OpenAI's GPT-4o (ang makina sa likod ng ChatGPT), at Gemini ng Google, na magagamit lamang sa pamamagitan ng mga API.
Para bigyan ang mga developer ng higit na flexibility, nakipagsosyo ang Meta sa mga cloud service provider gaya ng AWS, Google Cloud, at Microsoft Azure para mag-alok ng mga cloud-host na bersyon ng Llama. Bukod pa rito, bumuo ang Meta ng mga tool na nagpapasimple sa proseso para sa mga developer na maayos at maiangkop ang modelo upang matugunan ang kanilang mga partikular na kinakailangan.
Nasa ibaba ang isang detalyadong paglalarawan ng Llama, kabilang ang kung ano ang magagawa nito, ang iba't ibang bersyon na inaalok nito, at kung paano mo ito magagamit nang epektibo.
Ano ang Llama?
Ang Llama ay hindi lamang isang modelo; ito ay sumasaklaw sa isang hanay ng mga modelo, tulad ng:
-
Llama 8B
-
Llama 70B
-
Llama 405B
Ang mga pinakabagong bersyon (Llama 3.1 8B, Llama 3.1 70B, at Llama 3.1 405B) ay inilabas noong Hulyo 2024. Ang mga modelong ito ay sinanay sa malawak na hanay ng mga pinagmumulan ng data, gaya ng mga web page sa iba't ibang wika, pampublikong code, mga file na available online, at sintetikong data na ginawa ng iba pang mga AI system.
Ang Llama 3.1 8B at 70B ay mga compact na modelo na maaaring magpatakbo ng iba't ibang device mula sa mga laptop hanggang sa mga server. Ang Llama 3.1 405B, sa kabilang banda, ay isang malakihang modelo na karaniwang nangangailangan ng hardware ng data center. Bagama't ang mas maliliit na modelo ay maaaring hindi kasing lakas ng 405B, nag-aalok ang mga ito ng mas mabilis na performance at na-optimize para sa pinababang storage at latency.
Nagtatampok ang lahat ng modelo ng Llama ng context window ng 128,000 token, na nagbibigay-daan sa kanila na humawak ng humigit-kumulang 100,000 salita (o 300 na pahina ng teksto). Ito ay halos ang haba ng mga aklat tulad ng Wuthering Heights o Harry Potter and the Prisoner of Azkaban. Ang isang mahabang window ng konteksto ay tumutulong sa modelo na mapanatili ang impormasyon mula sa mga kamakailang dokumento at data, na binabawasan ang panganib na malihis sa labas ng paksa.
Ano ang Magagawa ni Llama?
Tulad ng iba pang generative AI models, makakatulong si Llama sa iba't ibang gawain, gaya ng coding, pagsagot sa mga simpleng tanong sa matematika at pagbubuod ng mga dokumento sa walong wika: English, German, French, Italian, Portuguese, Hindi, Spanish at Thai. Maaari nitong pangasiwaan ang karamihan sa mga gawaing nakabatay sa text, gaya ng pagsusuri ng mga file tulad ng mga PDF at spreadsheet, ngunit sa kasalukuyan ay wala itong kakayahang bumuo o magproseso ng mga larawan — isang bagay na maaaring magbago sa hinaharap.
Maaaring isama ang mga modelong Llama sa mga third-party na app, tool, at API para magsagawa ng iba't ibang gawain. Naka-configure ang mga ito na gumamit ng Brave Search upang sagutin ang mga tanong tungkol sa mga kasalukuyang kaganapan, ang Wolfram Alpha API para sa mga query sa matematika at agham, at isang Python interpreter para sa pagpapatunay ng code. Ayon sa Meta, ang Llama 3.1 ay maaaring gumamit ng ilang mga tool na hindi pa tahasang sinanay, kahit na ang pagiging maaasahan ng tampok na ito ay hindi pa rin sigurado.
Saan Mo Magagamit ang Llama?
Kung gusto mong direktang kumonekta kay Llama, sinusuportahan ang Meta AI chatbot na karanasan sa mga platform tulad ng Facebook Messenger, WhatsApp, Instagram, Oculus, at Meta.ai.
Para sa mga developer, available ang Llama para sa pag-download at maaaring i-scale sa ilang sikat na cloud platform. Nakipagsosyo ang Meta sa mahigit 25 kumpanya para mag-host ng Llama, kabilang ang Nvidia, Databricks, Groq, Dell, at Snowflake. Marami sa mga partner na ito ang nagbibigay ng mga karagdagang tool na nagbibigay-daan sa Llama na ma-access ang pagmamay-ari na data o tumakbo nang mas mahusay.
Iminumungkahi ng Meta ang paggamit ng mas maliliit na modelo ng Llama, partikular ang 8B at 70B, para sa mga pangkalahatang layunin tulad ng pagpapatakbo ng mga chatbot o paggawa ng code. Sa kabilang banda, ang mas malaking Llama 405B ay mas angkop para sa mga gawain tulad ng model distillation, na kinabibilangan ng paglilipat ng kaalaman mula sa isang mas malaking modelo patungo sa isang mas maliit, pati na rin sa pagbuo ng sintetikong data upang sanayin ang iba pang mga modelo.
Ang mga developer na nagpapatakbo ng mga application na may higit sa 700 milyong buwanang mga gumagamit ay dapat kumuha ng isang espesyal na lisensya mula sa Meta upang ma-access ang Llama, at ito ay ibibigay sa pagpapasya ng Meta.
Anong Mga Tool ang Inaalok ng Meta para sa Llama?
Ipinakilala ng Meta ang ilang mga tool upang mapabuti ang seguridad ni Llama:
-
Llama Guard: Isang moderation framework na tumutukoy sa may problemang content gaya ng hate speech, pananakit sa sarili, at paglabag sa copyright.
-
Prompt Guard: Isang tool na partikular na idinisenyo upang protektahan ang Llama mula sa mga nakakapinsalang mensahe na naglalayong laktawan ang mga hakbang sa seguridad nito.
-
CyberSecEval: Isang cybersecurity risk assessment suite na sinusuri ang seguridad ng modelo, na tumutuon sa mga banta gaya ng automated social engineering at mga nakakasakit na aktibidad sa cyber.
Halimbawa, ang Llama Guard ay maaaring makakita ng mapaminsalang o ilegal na nilalaman na ipinasok o nabuo sa Llama, na nagpapahintulot sa mga developer na i-customize kung aling mga kategorya ang naka-block. Nakatuon ang Prompt Guard sa pagtatanggol laban sa "mga pag-atake sa iniksyon ng mensahe" na nagtatangkang manipulahin ang modelo. Nag-aalok ang CyberSecEval ng mga benchmark para sa pagtatasa ng mga panganib sa seguridad na nauugnay sa mga modelo ng Llama.
Mga Limitasyon ni Llama
Ang Llama, tulad ng iba pang mga generative na modelo ng AI, ay may mga limitasyon at potensyal na panganib. Isa sa mga pangunahing alalahanin ay kung ang Meta ay gumamit ng mga naka-copyright na materyales upang sanayin si Llama. Kung ganoon ang sitwasyon, maaaring maharap ang mga user ng pananagutan para sa anumang naka-copyright na content na nabuo ng modelo.
Isinasaad ng mga kamakailang ulat na ang Meta ay gumagamit ng mga naka-copyright na e-book para sa pagsasanay sa AI, sa kabila ng nakatanggap ng mga legal na babala. Isinasama rin ng kumpanya ang nilalaman mula sa Instagram at Facebook sa pagsasanay ng modelo nito, na nagpapahirap sa mga user na mag-opt out. Ang Meta ay nahaharap sa maraming demanda, kabilang ang isa mula sa mga may-akda tulad ni Sarah Silverman, na nagsasabing ang kumpanya ay gumamit ng naka-copyright na materyal nang walang pahintulot.
Ang isang mahalagang pagsasaalang-alang ay ang programming, dahil maaaring gumawa si Llama ng buggy o hindi ligtas na code. Napakahalaga na ang mga developer ay magkaroon ng isang eksperto sa tao na suriin ang anumang code na binuo ng AI bago ito ipatupad sa kanilang mga application.
Bagama't nag-aalok ang modelo ng Llama ng Meta ng malaking flexibility at mga pagkakataon para sa mga developer, mahalagang kilalanin ang mga potensyal na panganib at limitasyon na kaakibat nito.
–
Inihatid sa iyo ng Code Labs Academy – Ang Iyong Nangunguna Online Coding Bootcamp para sa Future Tech Innovators.