Ikon situs web Pakar Digital

Meta merilis seri model AI baru Llama 4 Scout, Maverick, dan Behemoth

Meta merilis seri model AI baru Llama 4 Scout, Maverick, dan Behemoth

Meta merilis seri model AI baru Llama 4 Scout, Maverick, dan Behemoth – Gambar: Xpert.Digital

Llama 4: Generasi baru sistem AI terbuka dari Meta

Llama 4 Terungkap: Kunci Meta Menuju Era AI Berikutnya

Pada tanggal 5 April 2025, Meta meluncurkan generasi terbaru model AI-nya, Llama 4. Model-model baru ini mewakili kemajuan signifikan dalam pengembangan sistem AI terbuka dan menampilkan sejumlah kemampuan inovatif yang secara substansial meningkatkan kinerja dan efisiensinya. Seri Llama 4 terdiri dari beberapa model, dua di antaranya sudah tersedia untuk umum, sementara model yang paling canggih masih dalam tahap pelatihan.

Berkaitan dengan ini:

Keluarga model Llama 4

Meta telah mengembangkan tiga model berbeda dalam seri Llama 4, masing-masing dioptimalkan untuk kasus penggunaan yang berbeda:

Llama 4 Scout

Llama 4 Scout adalah model kompak dengan spesifikasi teknis yang mengesankan:

  • 17 miliar parameter aktif dengan 16 pakar (total 109 miliar parameter)
  • Dapat dioperasikan pada satu GPU NVIDIA H100 dengan kuantisasi Int4
  • Fitur ini memiliki jendela konteks yang sangat besar, yaitu 10 juta token, menjadikannya salah satu model terbuka pertama dengan kapasitas ini

Menurut Meta, Scout mengungguli model lain di kelasnya, seperti Gemini 3, Gemini 2.0 Flash-Lite, dan Mistral 3.1. Model ini sangat cocok untuk tugas-tugas seperti meringkas dokumen panjang, mempersonalisasi konten berdasarkan data pengguna, dan menarik kesimpulan kompleks dari sejumlah besar pengetahuan.

Llama 4 Maverick

Llama 4 Maverick adalah model yang lebih bertenaga dari dua model yang tersedia:

  • 17 miliar parameter aktif dengan 128 pakar (total 400 miliar parameter)
  • Versi obrolan eksperimental mencapai ELO 1417 di LMArena
  • Menurut Meta, performanya lebih baik daripada model seperti GPT-4o dan Gemini 2.0 Flash dalam berbagai benchmark

Model ini sangat cocok untuk aplikasi bantuan umum dan obrolan seperti penulisan kreatif dan menunjukkan hasil yang sebanding dengan DeepSeek v3 dalam tugas penalaran dan pengkodean, tetapi dengan setengah parameter.

Llama 4 Behemoth

Llama 4 Behemoth adalah model terkuat Meta, tetapi belum tersedia untuk umum:

  • 288 miliar parameter aktif dengan 16 pakar (hampir 2 triliun parameter secara total)
  • Menurut Meta, performanya lebih baik daripada GPT-4.5, Claude Sonnet 3.7, dan Gemini 2.0 Pro dalam beberapa benchmark STEM
  • Berfungsi sebagai "model guru" untuk model Llama 4 yang lebih kecil

Behemoth saat ini masih dalam tahap pelatihan dan akan dirilis di kemudian hari.

Inovasi teknis

Seri model Llama 4 memperkenalkan beberapa inovasi teknis signifikan yang meningkatkan kinerja dan efisiensinya:

Arsitektur Campuran Pakar (MoE)

Salah satu inovasi terpenting dalam Llama 4 adalah arsitektur Mixture of Experts (MoE), di mana hanya sebagian dari parameter model yang diaktifkan untuk setiap token:

  • Hal ini secara signifikan mengurangi upaya komputasi dan latensi, sambil mempertahankan kinerja yang tinggi
  • Di Llama 4 Maverick, setiap token diproses oleh seorang ahli bersama dan salah satu dari 128 ahli yang ditunjuk
  • Arsitektur ini memungkinkan peningkatan parameter keseluruhan model tanpa meningkatkan biaya inferensi

Multimodalitas asli dengan fusi dini

Llama 4 adalah model terbuka pertama dengan multimodalitas bawaan melalui Early Fusion:

  • Token teks dan gambar diintegrasikan ke dalam arsitektur model yang terpadu
  • Hal ini memungkinkan pelatihan awal bersama dengan sejumlah besar data teks, gambar, dan video
  • Berbeda dengan Llama 3.2 yang menggunakan parameter terpisah untuk teks dan gambar, Llama 4 memahami kedua modalitas tersebut secara native dengan parameter yang sama

Jendela konteks yang sangat panjang

Jendela konteks yang sangat panjang pada Llama 4 Scout sangat mengesankan:

  • Dengan 10 juta token, ini secara signifikan melampaui sebagian besar model yang tersedia
  • Hal ini memungkinkan pemrosesan dokumen yang sangat panjang, seluruh basis kode, atau percakapan yang ekstensif
  • Arsitektur iRoPE (lapisan perhatian yang saling berselang-seling) memungkinkan hal ini

Metode pelatihan baru

Meta telah menggunakan beberapa metode inovatif untuk melatih Llama 4:

  • MetaP: Sebuah teknik untuk menyetel parameter hiper kritis model secara andal
  • Presisi FP8: Menggunakan bilangan floating-point 8-bit untuk pelatihan yang efisien
  • Ko-distilasi: Menggunakan Llama 4 Behemoth sebagai model pengajaran untuk model yang lebih kecil
  • Pembelajaran daring sepenuhnya asinkron dengan amplifikasi: Infrastruktur baru untuk pembelajaran skala besar

Ketersediaan dan integrasi

Model Llama 4 tersedia melalui berbagai platform dan layanan:

Penyedia unduhan dan cloud

  • Model Scout dan Maverick dapat diunduh langsung dari Meta atau melalui Hugging Face
  • Layanan ini juga tersedia melalui berbagai platform cloud:
    • AI Pekerja Cloudflare
    • Azure AI Foundry dan Azure Databricks
    • Vertex AI milik Google Cloud
    • Mitra lainnya akan menyusul dalam beberapa hari mendatang

Integrasi ke dalam meta-produk

Meta telah memperbarui asisten AI-nya ke Llama 4 di berbagai platform:

  • WhatsApp, Messenger, dan Instagram Direct di 40 negara berbeda
  • Situs web Meta.AI
  • Namun, fitur multimodal saat ini hanya tersedia untuk pengguna berbahasa Inggris di Amerika Serikat

Berkaitan dengan ini:

Perizinan dan Kontroversi

Meskipun Meta Llama 4 digambarkan sebagai "sumber terbuka", ada beberapa batasan dalam lisensi yang telah memicu kontroversi:

Pembatasan lisensi

Lisensi Komunitas Llama 4 berisi beberapa pembatasan:

  • Perusahaan dengan lebih dari 700 juta pengguna aktif bulanan memerlukan lisensi khusus dari Meta
  • Pengguna dan perusahaan dari Uni Eropa tampaknya tidak diizinkan untuk menggunakan atau mendistribusikan model-model tersebut, kemungkinan karena persyaratan peraturan
  • Terdapat persyaratan terkait penamaan dan atribusi model turunan

Debat tentang “Sumber Terbuka”

Ada perdebatan tentang apakah Llama 4 sebenarnya layak disebut "Sumber Terbuka":

  • Open Source Initiative menetapkan pada tahun 2023 bahwa pembatasan dalam lisensi Llama membuatnya "keluar dari kategori 'sumber terbuka'"
  • Para kritikus berpendapat bahwa ini lebih merupakan model "sumber terbuka" atau "bobot terbuka" daripada perangkat lunak sumber terbuka sejati
  • Pembatasan perizinan dapat menjadi masalah bagi usaha kecil yang tidak memiliki departemen hukum sendiri

Rencana masa depan

Meta telah memberikan beberapa bocoran tentang rencana masa depannya untuk Llama 4 dan seterusnya:

LlamaCon dan pengumuman lainnya

  • Meta akan menyelenggarakan konferensi LlamaCon pertamanya pada tanggal 29 April 2025, di mana detail lebih lanjut tentang model AI dan rencana produknya akan diumumkan
  • Perusahaan ini juga berencana untuk merilis aplikasi khusus untuk meta chatbot-nya pada kuartal kedua

Memperluas kemampuan berbahasa

  • Meta sedang berupaya meningkatkan kemampuan berbahasa Llama 4 untuk memungkinkan percakapan yang lebih alami
  • Tujuannya adalah untuk memungkinkan dialog dua arah yang lebih lancar di mana pengguna dapat menyela model AI
  • Chris Cox, Chief Product Officer dari Meta, menggambarkan Llama 4 yang akan datang sebagai "model omni" yang memungkinkan penggunaan bahasa asli alih-alih menerjemahkan ucapan ke teks

AI berbasis agen dan kemampuan yang ditingkatkan

  • Mark Zuckerberg telah mengumumkan bahwa Llama 4 akan memiliki "kemampuan agensi" yang akan memungkinkan kasus penggunaan baru
  • Meta bertujuan untuk mengembangkan model AI yang dapat “melakukan tindakan umum, berkomunikasi secara alami dengan manusia, dan memecahkan masalah yang menantang.”
  • Perusahaan tersebut sedang mempertimbangkan untuk menawarkan langganan premium untuk asisten AI-nya untuk keperluan yang berkaitan dengan agen, seperti reservasi atau produksi video

Mengapa Llama 4 merupakan titik balik dalam lanskap AI

Peluncuran Llama 4 merupakan langkah signifikan dalam strategi Meta untuk menjadi pemimpin di bidang AI generatif yang sangat kompetitif. Dengan diperkenalkannya arsitektur Mixture of Experts, multimodality asli, dan jendela konteks yang sangat panjang, Meta menunjukkan bahwa model terbuka dapat bersaing dengan model eksklusif perusahaan teknologi besar.

Terlepas dari kontroversi seputar perizinan dan pertanyaan apakah Llama 4 benar-benar layak disebut "sumber terbuka," kemajuan teknisnya merupakan tonggak penting. Kemampuan model untuk memproses teks dan gambar membuka kemungkinan baru bagi pengembang dan bisnis.

Dengan Llama 4 Behemoth yang masih tertunda dan rencana yang diumumkan untuk peningkatan kemampuan bahasa dan agen, jelas bahwa Meta akan semakin mengintensifkan investasinya di bidang AI. Beberapa bulan mendatang akan menunjukkan bagaimana model-model baru ini akan mengubah lanskap AI dan apakah model-model ini benar-benar akan, seperti yang diprediksi Mark Zuckerberg, membantu model AI terbuka menjadi kekuatan utama dalam kecerdasan buatan.

Berkaitan dengan ini:

 

Mitra pemasaran dan pengembangan bisnis global Anda

☑️ Bahasa bisnis kami adalah bahasa Inggris atau Jerman

☑️ BARU: Korespondensi dalam bahasa ibu Anda!

 

Konrad Wolfenstein

Saya dan tim saya dengan senang hati siap membantu Anda sebagai penasihat pribadi Anda.

Anda dapat menghubungi saya dengan mengisi formulir kontak di sini cukup hubungi saya di +49 7348 4088 965. Alamat email saya adalah wolfenstein@xpert.digital:atau

Saya sangat menantikan proyek bersama kita.

 

 

☑️ Dukungan UKM dalam strategi, konsultasi, perencanaan, dan implementasi

☑️ Pembuatan atau penyesuaian kembali strategi digital dan digitalisasi

☑️ Perluasan dan optimalisasi proses penjualan internasional

☑️ Platform perdagangan B2B global & digital

☑️ Pelopor Pengembangan Bisnis / Pemasaran / Humas / Pameran Dagang

Tinggalkan versi seluler