Meta merilis seri model AI baru Llama 4 Scout, Maverick, dan Behemoth

Konrad Wolfenstein

1 tahun yang lalu

Meta merilis seri model AI baru Llama 4 Scout, Maverick, dan Behemoth – Gambar: Xpert.Digital

Llama 4: Generasi baru sistem AI terbuka dari Meta

Llama 4 Terungkap: Kunci Meta Menuju Era AI Berikutnya

Pada tanggal 5 April 2025, Meta meluncurkan generasi terbaru model AI-nya, Llama 4. Model-model baru ini mewakili kemajuan signifikan dalam pengembangan sistem AI terbuka dan menampilkan sejumlah kemampuan inovatif yang secara substansial meningkatkan kinerja dan efisiensinya. Seri Llama 4 terdiri dari beberapa model, dua di antaranya sudah tersedia untuk umum, sementara model yang paling canggih masih dalam tahap pelatihan.

Berkaitan dengan ini:

Model AI dijelaskan secara sederhana: Memahami dasar-dasar AI, model bahasa, dan penalaran

Keluarga model Llama 4

Meta telah mengembangkan tiga model berbeda dalam seri Llama 4, masing-masing dioptimalkan untuk kasus penggunaan yang berbeda:

Llama 4 Scout

Llama 4 Scout adalah model kompak dengan spesifikasi teknis yang mengesankan:

17 miliar parameter aktif dengan 16 pakar (total 109 miliar parameter)
Dapat dioperasikan pada satu GPU NVIDIA H100 dengan kuantisasi Int4
Fitur ini memiliki jendela konteks yang sangat besar, yaitu 10 juta token, menjadikannya salah satu model terbuka pertama dengan kapasitas ini

Menurut Meta, Scout mengungguli model lain di kelasnya, seperti Gemini 3, Gemini 2.0 Flash-Lite, dan Mistral 3.1. Model ini sangat cocok untuk tugas-tugas seperti meringkas dokumen panjang, mempersonalisasi konten berdasarkan data pengguna, dan menarik kesimpulan kompleks dari sejumlah besar pengetahuan.

Llama 4 Maverick

Llama 4 Maverick adalah model yang lebih bertenaga dari dua model yang tersedia:

17 miliar parameter aktif dengan 128 pakar (total 400 miliar parameter)
Versi obrolan eksperimental mencapai ELO 1417 di LMArena
Menurut Meta, performanya lebih baik daripada model seperti GPT-4o dan Gemini 2.0 Flash dalam berbagai benchmark

Model ini sangat cocok untuk aplikasi bantuan umum dan obrolan seperti penulisan kreatif dan menunjukkan hasil yang sebanding dengan DeepSeek v3 dalam tugas penalaran dan pengkodean, tetapi dengan setengah parameter.

Llama 4 Behemoth

Llama 4 Behemoth adalah model terkuat Meta, tetapi belum tersedia untuk umum:

288 miliar parameter aktif dengan 16 pakar (hampir 2 triliun parameter secara total)
Menurut Meta, performanya lebih baik daripada GPT-4.5, Claude Sonnet 3.7, dan Gemini 2.0 Pro dalam beberapa benchmark STEM
Berfungsi sebagai "model guru" untuk model Llama 4 yang lebih kecil

Behemoth saat ini masih dalam tahap pelatihan dan akan dirilis di kemudian hari.

Inovasi teknis

Seri model Llama 4 memperkenalkan beberapa inovasi teknis signifikan yang meningkatkan kinerja dan efisiensinya:

Arsitektur Campuran Pakar (MoE)

Salah satu inovasi terpenting dalam Llama 4 adalah arsitektur Mixture of Experts (MoE), di mana hanya sebagian dari parameter model yang diaktifkan untuk setiap token:

Hal ini secara signifikan mengurangi upaya komputasi dan latensi, sambil mempertahankan kinerja yang tinggi
Di Llama 4 Maverick, setiap token diproses oleh seorang ahli bersama dan salah satu dari 128 ahli yang ditunjuk
Arsitektur ini memungkinkan peningkatan parameter keseluruhan model tanpa meningkatkan biaya inferensi

Multimodalitas asli dengan fusi dini

Llama 4 adalah model terbuka pertama dengan multimodalitas bawaan melalui Early Fusion:

Token teks dan gambar diintegrasikan ke dalam arsitektur model yang terpadu
Hal ini memungkinkan pelatihan awal bersama dengan sejumlah besar data teks, gambar, dan video
Berbeda dengan Llama 3.2 yang menggunakan parameter terpisah untuk teks dan gambar, Llama 4 memahami kedua modalitas tersebut secara native dengan parameter yang sama

Jendela konteks yang sangat panjang

Jendela konteks yang sangat panjang pada Llama 4 Scout sangat mengesankan:

Dengan 10 juta token, ini secara signifikan melampaui sebagian besar model yang tersedia
Hal ini memungkinkan pemrosesan dokumen yang sangat panjang, seluruh basis kode, atau percakapan yang ekstensif
Arsitektur iRoPE (lapisan perhatian yang saling berselang-seling) memungkinkan hal ini

Metode pelatihan baru

Meta telah menggunakan beberapa metode inovatif untuk melatih Llama 4:

MetaP: Sebuah teknik untuk menyetel parameter hiper kritis model secara andal
Presisi FP8: Menggunakan bilangan floating-point 8-bit untuk pelatihan yang efisien
Ko-distilasi: Menggunakan Llama 4 Behemoth sebagai model pengajaran untuk model yang lebih kecil
Pembelajaran daring sepenuhnya asinkron dengan amplifikasi: Infrastruktur baru untuk pembelajaran skala besar

Ketersediaan dan integrasi

Model Llama 4 tersedia melalui berbagai platform dan layanan:

Penyedia unduhan dan cloud

Model Scout dan Maverick dapat diunduh langsung dari Meta atau melalui Hugging Face
Layanan ini juga tersedia melalui berbagai platform cloud:
- AI Pekerja Cloudflare
- Azure AI Foundry dan Azure Databricks
- Vertex AI milik Google Cloud
- Mitra lainnya akan menyusul dalam beberapa hari mendatang

Integrasi ke dalam meta-produk

Meta telah memperbarui asisten AI-nya ke Llama 4 di berbagai platform:

WhatsApp, Messenger, dan Instagram Direct di 40 negara berbeda
Situs web Meta.AI
Namun, fitur multimodal saat ini hanya tersedia untuk pengguna berbahasa Inggris di Amerika Serikat

Berkaitan dengan ini:

Meta AI hadir di Jerman! WhatsApp, Instagram & Facebook mendapatkan AI – dengan perbedaan penting dari versi AS

Perizinan dan Kontroversi

Meskipun Meta Llama 4 digambarkan sebagai "open source", terdapat beberapa batasan dalam lisensinya yang telah memicu kontroversi:

Pembatasan lisensi

Lisensi Komunitas Llama 4 berisi beberapa pembatasan:

Perusahaan dengan lebih dari 700 juta pengguna aktif bulanan memerlukan lisensi khusus dari Meta
Pengguna dan perusahaan dari Uni Eropa tampaknya tidak diizinkan untuk menggunakan atau mendistribusikan model-model tersebut, kemungkinan karena persyaratan peraturan
Terdapat persyaratan terkait penamaan dan atribusi model turunan

Debat tentang “Sumber Terbuka”

Ada perdebatan tentang apakah Llama 4 sebenarnya layak disebut "open source":

Open Source Initiative menetapkan pada tahun 2023 bahwa pembatasan dalam lisensi Llama membuatnya "keluar dari kategori 'sumber terbuka'"
Para kritikus berpendapat bahwa ini lebih merupakan model "sumber terbuka" atau "bobot terbuka" daripada perangkat lunak sumber terbuka sejati
Pembatasan perizinan dapat menjadi masalah bagi usaha kecil yang tidak memiliki departemen hukum sendiri

Rencana masa depan

Meta telah memberikan beberapa bocoran tentang rencana masa depannya untuk Llama 4 dan seterusnya:

LlamaCon dan pengumuman lainnya

Meta akan menyelenggarakan konferensi LlamaCon pertamanya pada tanggal 29 April 2025, di mana detail lebih lanjut tentang model AI dan rencana produknya akan diumumkan
Perusahaan ini juga berencana untuk merilis aplikasi khusus untuk meta chatbot-nya pada kuartal kedua

Memperluas kemampuan berbahasa

Meta sedang berupaya meningkatkan kemampuan berbahasa Llama 4 untuk memungkinkan percakapan yang lebih alami
Tujuannya adalah untuk memungkinkan dialog dua arah yang lebih lancar di mana pengguna dapat menyela model AI
Chris Cox, Chief Product Officer dari Meta, menggambarkan Llama 4 yang akan datang sebagai "model omni" yang memungkinkan penggunaan bahasa asli alih-alih menerjemahkan ucapan ke teks

AI berbasis agen dan kemampuan yang ditingkatkan

Mark Zuckerberg telah mengumumkan bahwa Llama 4 akan memiliki "kemampuan agen" yang akan memungkinkan kasus penggunaan baru
Meta bertujuan untuk mengembangkan model AI yang dapat "melakukan tindakan umum, berkomunikasi secara alami dengan manusia, dan memecahkan masalah yang menantang."
Perusahaan tersebut sedang mempertimbangkan untuk menawarkan langganan premium untuk asisten AI-nya untuk keperluan yang berkaitan dengan agen, seperti reservasi atau produksi video

Mengapa Llama 4 merupakan titik balik dalam lanskap AI

Peluncuran Llama 4 merupakan langkah signifikan dalam strategi Meta untuk menjadi pemimpin di bidang AI generatif yang sangat kompetitif. Dengan diperkenalkannya arsitektur Mixture of Experts, multimodality asli, dan jendela konteks yang sangat panjang, Meta menunjukkan bahwa model terbuka dapat bersaing dengan model eksklusif perusahaan teknologi besar.

Terlepas dari kontroversi seputar perizinan dan pertanyaan apakah Llama 4 benar-benar layak disebut "sumber terbuka," kemajuan teknisnya merupakan tonggak penting. Kemampuan model untuk memproses teks dan gambar membuka kemungkinan baru bagi pengembang dan bisnis.

Dengan Llama 4 Behemoth yang masih tertunda dan rencana yang diumumkan untuk peningkatan kemampuan bahasa dan agen, jelas bahwa Meta akan semakin mengintensifkan investasinya di bidang AI. Beberapa bulan mendatang akan menunjukkan bagaimana model-model baru ini akan mengubah lanskap AI dan apakah model-model ini benar-benar akan, seperti yang diprediksi Mark Zuckerberg, membantu model AI terbuka menjadi kekuatan utama dalam kecerdasan buatan.

Berkaitan dengan ini:

Mitra pemasaran dan pengembangan bisnis global Anda

☑️ Bahasa bisnis kami adalah bahasa Inggris atau Jerman

☑️ BARU: Korespondensi dalam bahasa ibu Anda!

Konrad Wolfenstein

Saya dan tim saya dengan senang hati siap membantu Anda sebagai penasihat pribadi Anda.

Anda dapat menghubungi saya dengan mengisi formulir kontak di sini wolfenstein@xpert.digital:atau cukup hubungi saya di +49 7348 4088 965. Alamat email saya adalah

Meta merilis seri model AI baru Llama 4 Scout, Maverick, dan Behemoth

Llama 4: Generasi baru sistem AI terbuka dari Meta