Meta baru saja meluncurkan dua model bahasa besar (LLM) terbaru dalam seri Llama 4: Llama 4 Scout dan Llama 4 Maverick. Kedua model ini merupakan model *open-weight native*, artinya parameter bobot model LLM-nya dapat diakses publik. Ini merupakan langkah signifikan Meta dalam mendorong keterbukaan dan kolaborasi dalam pengembangan AI.
Keunikan Llama 4 Scout dan Maverick terletak pada arsitektur *Mixture of Experts* (MoE) yang digunakan. MoE memungkinkan model untuk menggunakan beberapa sub-model khusus (“experts”) untuk menangani bagian-bagian input teks yang berbeda. Hal ini menghasilkan efisiensi komputasi yang lebih tinggi dibandingkan model LLM tradisional, baik dalam pelatihan maupun saat menjawab pertanyaan.
Model-model ini dilatih dengan menggunakan kumpulan data besar yang mencakup teks, gambar, dan video tanpa label. Pendekatan ini memungkinkan Llama 4 Scout dan Maverick untuk memiliki pemahaman yang lebih komprehensif tentang dunia visual, dan bukan hanya teks saja.
Perbedaan Llama 4 Scout dan Llama 4 Maverick
Meskipun keduanya menggunakan arsitektur MoE, Scout dan Maverick memiliki spesifikasi dan kemampuan yang berbeda. Scout dirancang untuk tugas-tugas yang lebih ringan, seperti meringkas dokumen dan penalaran berbasis kode. Ia memiliki 109 miliar parameter total, 17 miliar parameter aktif, dan 16 “experts”. Scout juga memiliki “jendela konteks” yang besar, yaitu 10 juta token, memungkinkan pemrosesan dokumen yang sangat panjang.
Maverick, di sisi lain, merupakan model yang jauh lebih besar dan kuat. Dengan 400 miliar parameter total (meski hanya 17 miliar parameter aktif dan 128 experts), Maverick cocok untuk tugas-tugas yang lebih kompleks, seperti menjadi asisten virtual, menghasilkan teks kreatif, dan memecahkan masalah yang rumit. Pengujian internal menunjukkan kinerja Maverick yang melampaui GPT-40 dan Gemini 2.0 dalam beberapa aspek.
Keunggulan Maverick
Maverick unggul dalam berbagai tugas, termasuk:
Keunggulan Scout
Sementara itu, keunggulan Scout terletak pada:
Dari segi kebutuhan komputasi, Scout dapat berjalan pada satu GPU Nvidia H100, sementara Maverick membutuhkan sistem yang lebih kuat, seperti satu Nvidia H100 DGX atau setara. Perbedaan ini mencerminkan kompleksitas dan kemampuan masing-masing model.
Llama 4 Behemoth: Model Masa Depan
Meta juga menyebutkan model LLM lainnya yang sedang dikembangkan, yaitu Llama 4 Behemoth. Behemoth diproyeksikan menjadi model yang jauh lebih kuat dari Maverick dan Scout, dengan 2 triliun parameter total, 288 miliar parameter aktif, dan 16 experts. Meta mengklaim Behemoth akan melampaui model AI kompetitor seperti GPT-4.5, Claude 3.7 Sonnet, dan Gemini 2.0 Pro.
Peluncuran Llama 4 Scout dan Maverick, serta rencana pengembangan Behemoth, menunjukkan komitmen Meta untuk terus berinovasi di bidang LLM. Dengan pendekatan *open-weight* dan arsitektur MoE yang efisien, Meta berupaya untuk mendorong perkembangan AI yang lebih inklusif dan bermanfaat bagi masyarakat luas. Penting untuk diingat bahwa token dalam konteks LLM adalah potongan-potongan teks mentah yang memecah kalimat menjadi beberapa bagian. Misalnya, kata “fantastis” bisa dipecah menjadi “fan”, “tas”, “tis”.
Ke depannya, akan menarik untuk melihat bagaimana Llama 4 Scout dan Maverick akan diadopsi dan diaplikasikan dalam berbagai bidang. Potensi keduanya sangat besar, mulai dari asisten virtual yang canggih hingga alat bantu penelitian dan pengembangan yang kuat.