⭐️ Kecerdasan buatan (AI) -AI Blog, hotspot, dan hub konten ⭐️ Kecerdasan Digital ⭐️ xpaper

Pemilihan suara 📢

Meta menerbitkan Llama 4 Scout, Maverick dan Behemoth baru

Diterbitkan pada: 6 April 2025 / Pembaruan Dari: 6 April 2025 - Penulis: Konrad Wolfenstein

Meta menerbitkan Llama 4 Scout, Maverick dan Behemoth-Image: Xpert.digital yang baru

Llama 4: Generasi Baru Sistem AI Terbuka dari Meta

Llama 4 Terungkap: Kunci Meta ke Zaman AI berikutnya

Meta mempresentasikan generasi terbaru dari model AI -nya, Llama 4, pada 5 April 2025. Model -model baru ini mewakili kemajuan yang signifikan dalam pengembangan sistem AI terbuka dan memiliki sejumlah fungsi inovatif yang secara signifikan meningkatkan kinerja dan efisiensi mereka. Seri Llama 4 terdiri dari model yang berbeda, dengan dua di antaranya sudah tersedia untuk umum, sedangkan model yang paling kuat masih dalam fase pelatihan.

Cocok untuk:

Cukup jelas model AI: pahami dasar -dasar AI, model suara dan penalaran

Keluarga Model Llama 4

Meta telah mengembangkan tiga model yang berbeda dalam seri LLAMA 4, yang masing -masing dioptimalkan untuk aplikasi yang berbeda:

Llama 4 Scout

Llama 4 Scout adalah model kompak dengan spesifikasi teknis yang mengesankan:

17 miliar parameter aktif dengan 16 ahli (total 109 miliar parameter)
Dapat dioperasikan pada GPU NVIDIA H100 tunggal dengan kuantisasi int4
Memiliki jendela konteks yang sangat besar dari 10 juta token, yang menjadikannya salah satu model terbuka pertama dengan kapasitas ini

Menurut Meta, Scout melebihi model lain di kelasnya seperti Gemini 3, Gemini 2.0 Flash-Lite dan Mistral 3.1. Ini sangat cocok untuk tugas -tugas seperti ringkasan dokumen panjang, personalisasi berdasarkan data pengguna dan kesimpulan kompleks tentang sejumlah besar pengetahuan.

Llama 4 maverick

Llama 4 Maverick adalah yang lebih kuat dari dua model yang tersedia:

17 miliar parameter aktif dengan 128 ahli (total 400 miliar parameter)
Versi obrolan eksperimental mencapai ELO 1417 di lmarena
Melebihi model seperti GPT-4O dan Gemini 2.0 Flash dalam banyak tolok ukur

Model ini sangat cocok untuk bantuan umum dan aplikasi obrolan seperti penulisan kreatif dan menunjukkan hasil yang sebanding dengan Deepseek V3 dalam tugas penalaran dan pengkodean, tetapi dengan setengah dari parameter.

Llama 4 raksasa

Llama 4 Behemoth adalah model Metas yang paling kuat, yang belum tersedia untuk umum:

288 miliar parameter aktif dengan 16 ahli (total hampir 2 triliun parameter)
Menurut Meta, itu melebihi GPT-4.5, Claude Sonnet 3.7 dan Gemini 2.0 Pro untuk beberapa tolok ukur batang
Berfungsi sebagai "model guru" untuk model Llama 4 yang lebih kecil

Behemoth saat ini masih dalam fase pelatihan dan akan diterbitkan di kemudian hari.

Inovasi teknis

Seri Model Llama 4 memperkenalkan beberapa inovasi teknis penting yang meningkatkan kinerja dan efisiensi mereka:

Campuran Arsitektur Pakar (MOE)

Salah satu inovasi terpenting di Llama 4 adalah arsitektur campuran para ahli (MOE), di mana hanya bagian dari parameter model yang diaktifkan untuk setiap token:

Ini secara signifikan mengurangi upaya perhitungan dan latensi, sementara kinerja tinggi dipertahankan
Di Llama 4 Maverick, masing -masing token diproses oleh ahli umum dan salah satu dari 128 ahli gereri
Arsitektur ini memungkinkan untuk meningkatkan parameter total model tanpa meningkatkan biaya inferensi

Multimodality asli dengan fusi awal

Llama 4 adalah model terbuka pertama dengan multimodality asli dengan fusi awal:

Token teks dan gambar diintegrasikan dalam arsitektur model yang seragam
Ini memungkinkan pelatihan pendahuluan bersama dengan data teks, gambar, dan video dalam jumlah besar
Berbeda dengan LLAMA 3.2, yang menggunakan parameter terpisah untuk teks dan gambar, Llama 4 memahami kedua modalitas asli dengan parameter yang sama

Jendela konteks yang sangat panjang

Jendela konteks yang sangat panjang dari Llama 4 Scout sangat mengesankan:

Dengan 10 juta token, jelas melebihi sebagian besar model yang tersedia
Ini memungkinkan pemrosesan dokumen yang sangat panjang, seluruh basis kode atau percakapan yang luas
Arsitektur Irope (lapisan perhatian yang diselingi) memungkinkan hal ini

Metode pelatihan baru

Meta telah menggunakan beberapa metode inovatif untuk pelatihan Llama 4:

Metap: Teknik untuk koordinasi yang kuat dari hiperameter model kritis
FP8 Precision: Penggunaan nomor buatan 8-bit untuk pelatihan yang efisien
Co-Distilasi: Penggunaan Llama 4 Behemoth sebagai model guru untuk model yang lebih kecil
Pembelajaran online yang sepenuhnya asinkron dengan bala bantuan: infrastruktur baru untuk pembelajaran skala besar

Ketersediaan dan integrasi

Model LLAMA 4 tersedia melalui berbagai platform dan layanan:

Unduh dan penyedia cloud

Model Scout dan Maverick dapat diunduh langsung dari meta atau melalui wajah memeluk
Mereka juga tersedia melalui berbagai platform cloud:
- Pekerja Cloudflare AI
- Azure AI Foundry dan Azure Databricks
- Google Cloud's Vertex AI
- Mitra lain akan mengikuti dalam beberapa hari mendatang

Integrasi ke dalam produk meta

Meta telah memperbarui asisten AI -nya di berbagai platform di Llama 4:

Whatsapp, messenger dan instagram langsung di 40 negara berbeda
Situs web meta.ai
Namun, fungsi multimodal saat ini hanya tersedia untuk pengguna bahasa Inggris di AS

Cocok untuk:

Meta AI di Jerman ada di sini! Whatsapp, Instagram & Facebook Dapatkan AI-dengan perbedaan penting dalam versi AS

Lisensi dan Kontroversi

Meskipun meta llama 4 mengacu pada "open source", ada beberapa batasan dalam lisensi yang memicu kontroversi:

Pembatasan lisensi

Lisensi Komunitas Llama 4 berisi beberapa batasan:

Perusahaan dengan lebih dari 700 juta pengguna aktif bulanan membutuhkan lisensi khusus dari Meta
Model tampaknya tidak diizinkan untuk menggunakan atau mendistribusikan pengguna dan perusahaan dari UE, mungkin karena persyaratan peraturan
Ada persyaratan tentang penamaan dan atribusi untuk model turunan

Debat tentang "open source"

Ada perdebatan tentang apakah Llama 4 harus benar -benar disebut "open source":

Inisiatif Sumber Terbuka Ditemukan pada tahun 2023 bahwa pembatasan dalam lisensi Llama mengeluarkannya "dari kategori" Sumber Terbuka ""
Kritikus berpendapat bahwa ini lebih merupakan model "sumber terbuka" atau "dengan bobot terbuka" daripada perangkat lunak sumber terbuka nyata
Pembatasan lisensi bisa menjadi masalah bagi perusahaan kecil tanpa departemen hukum mereka sendiri

Rencana masa depan

Meta telah memberikan beberapa wawasan tentang rencana masa depannya untuk Llama 4 dan seterusnya:

Llamacon dan pengumuman lainnya

Meta akan menyelenggarakan Konferensi Llamacon pertama pada tanggal 29 April 2025, di mana rincian lebih lanjut tentang model AI dan rencana produknya akan diumumkan
Perusahaan juga berencana untuk menerbitkan aplikasi khusus untuk bot meta-obrolan di kuartal kedua

Perluasan Keterampilan Bahasa

Meta sedang berupaya meningkatkan keterampilan bahasa Llama 4 untuk memungkinkan percakapan yang lebih alami
Tujuannya adalah untuk mengaktifkan lebih banyak dialog dua sisi cairan di mana pengguna dapat mengganggu model AI
Chris Cox, Kepala Petugas Produk Meta, menggambarkan Llama 4 yang akan datang sebagai "model omni" yang memungkinkan bahasa asli alih -alih menerjemahkan bahasa ke dalam teks

AI agen dan keterampilan yang diperluas

Mark Zuckerberg telah mengumumkan bahwa Llama 4 akan memiliki "keterampilan agen" yang akan memungkinkan aplikasi baru
Meta bertujuan untuk mengembangkan model AI yang “melakukan tindakan umum, tentu saja berkomunikasi dengan orang -orang dan memecahkan masalah yang menantang”
Perusahaan sedang mempertimbangkan untuk menawarkan langganan premium untuk asisten AI untuk tujuan agen seperti reservasi atau produksi video

Mengapa Llama 4 adalah titik balik dalam lanskap AI

Publikasi Llama 4 merupakan langkah signifikan dalam strategi METAS untuk menjadi area terkemuka AI generatif di area yang sangat kompetitif. Dengan diperkenalkannya campuran arsitektur ahli, multimodality asli dan jendela konteks yang sangat panjang, meta menunjukkan bahwa model terbuka dapat mengikuti model eksklusif perusahaan teknologi besar.

Terlepas dari kontroversi tentang lisensi dan pertanyaan apakah Llama 4 harus benar -benar disebut sebagai "sumber terbuka", kemajuan teknis adalah tonggak penting. Kemampuan model untuk memproses teks dan gambar membuka peluang baru bagi pengembang dan perusahaan.

Dengan raksasa Llama 4 yang luar biasa dan rencana yang diumumkan untuk keterampilan bahasa dan agen yang diperluas, jelas bahwa Meta akan semakin mengintensifkan investasinya di AI. Bulan -bulan mendatang akan menunjukkan bagaimana model -model baru ini mengubah lanskap AI dan apakah, seperti yang diprediksi oleh Mark Zuckerberg, mereka sebenarnya akan membantu membuat model AI terbuka di bidang kecerdasan buatan.

Cocok untuk:

Mitra pemasaran global dan pengembangan bisnis Anda

☑️ Bahasa bisnis kami adalah Inggris atau Jerman

☑️ BARU: Korespondensi dalam bahasa nasional Anda!

Konrad Wolfenstein

Saya akan dengan senang hati melayani Anda dan tim saya sebagai penasihat pribadi.

Anda dapat menghubungi saya dengan mengisi formulir kontak atau cukup hubungi saya di +49 89 89 674 804 (Munich) . Alamat email saya adalah: wolfenstein ∂ xpert.digital

Saya menantikan proyek bersama kita.