Diterbitkan pada: 6 April 2025 / Pembaruan Dari: 6 April 2025 - Penulis: Konrad Wolfenstein
Llama 4: Generasi Baru Sistem AI Terbuka dari Meta
Llama 4 Terungkap: Kunci Meta ke Zaman AI berikutnya
Meta mempresentasikan generasi terbaru dari model AI -nya, Llama 4, pada 5 April 2025. Model -model baru ini mewakili kemajuan yang signifikan dalam pengembangan sistem AI terbuka dan memiliki sejumlah fungsi inovatif yang secara signifikan meningkatkan kinerja dan efisiensi mereka. Seri Llama 4 terdiri dari model yang berbeda, dengan dua di antaranya sudah tersedia untuk umum, sedangkan model yang paling kuat masih dalam fase pelatihan.
Cocok untuk:
Keluarga Model Llama 4
Meta telah mengembangkan tiga model yang berbeda dalam seri LLAMA 4, yang masing -masing dioptimalkan untuk aplikasi yang berbeda:
Llama 4 Scout
Llama 4 Scout adalah model kompak dengan spesifikasi teknis yang mengesankan:
- 17 miliar parameter aktif dengan 16 ahli (total 109 miliar parameter)
- Dapat dioperasikan pada GPU NVIDIA H100 tunggal dengan kuantisasi int4
- Memiliki jendela konteks yang sangat besar dari 10 juta token, yang menjadikannya salah satu model terbuka pertama dengan kapasitas ini
Menurut Meta, Scout melebihi model lain di kelasnya seperti Gemini 3, Gemini 2.0 Flash-Lite dan Mistral 3.1. Ini sangat cocok untuk tugas -tugas seperti ringkasan dokumen panjang, personalisasi berdasarkan data pengguna dan kesimpulan kompleks tentang sejumlah besar pengetahuan.
Llama 4 maverick
Llama 4 Maverick adalah yang lebih kuat dari dua model yang tersedia:
- 17 miliar parameter aktif dengan 128 ahli (total 400 miliar parameter)
- Versi obrolan eksperimental mencapai ELO 1417 di lmarena
- Melebihi model seperti GPT-4O dan Gemini 2.0 Flash dalam banyak tolok ukur
Model ini sangat cocok untuk bantuan umum dan aplikasi obrolan seperti penulisan kreatif dan menunjukkan hasil yang sebanding dengan Deepseek V3 dalam tugas penalaran dan pengkodean, tetapi dengan setengah dari parameter.
Llama 4 raksasa
Llama 4 Behemoth adalah model Metas yang paling kuat, yang belum tersedia untuk umum:
- 288 miliar parameter aktif dengan 16 ahli (total hampir 2 triliun parameter)
- Menurut Meta, itu melebihi GPT-4.5, Claude Sonnet 3.7 dan Gemini 2.0 Pro untuk beberapa tolok ukur batang
- Berfungsi sebagai "model guru" untuk model Llama 4 yang lebih kecil
Behemoth saat ini masih dalam fase pelatihan dan akan diterbitkan di kemudian hari.
Inovasi teknis
Seri Model Llama 4 memperkenalkan beberapa inovasi teknis penting yang meningkatkan kinerja dan efisiensi mereka:
Campuran Arsitektur Pakar (MOE)
Salah satu inovasi terpenting di Llama 4 adalah arsitektur campuran para ahli (MOE), di mana hanya bagian dari parameter model yang diaktifkan untuk setiap token:
- Ini secara signifikan mengurangi upaya perhitungan dan latensi, sementara kinerja tinggi dipertahankan
- Di Llama 4 Maverick, masing -masing token diproses oleh ahli umum dan salah satu dari 128 ahli gereri
- Arsitektur ini memungkinkan untuk meningkatkan parameter total model tanpa meningkatkan biaya inferensi
Multimodality asli dengan fusi awal
Llama 4 adalah model terbuka pertama dengan multimodality asli dengan fusi awal:
- Token teks dan gambar diintegrasikan dalam arsitektur model yang seragam
- Ini memungkinkan pelatihan pendahuluan bersama dengan data teks, gambar, dan video dalam jumlah besar
- Berbeda dengan LLAMA 3.2, yang menggunakan parameter terpisah untuk teks dan gambar, Llama 4 memahami kedua modalitas asli dengan parameter yang sama
Jendela konteks yang sangat panjang
Jendela konteks yang sangat panjang dari Llama 4 Scout sangat mengesankan:
- Dengan 10 juta token, jelas melebihi sebagian besar model yang tersedia
- Ini memungkinkan pemrosesan dokumen yang sangat panjang, seluruh basis kode atau percakapan yang luas
- Arsitektur Irope (lapisan perhatian yang diselingi) memungkinkan hal ini
Metode pelatihan baru
Meta telah menggunakan beberapa metode inovatif untuk pelatihan Llama 4:
- Metap: Teknik untuk koordinasi yang kuat dari hiperameter model kritis
- FP8 Precision: Penggunaan nomor buatan 8-bit untuk pelatihan yang efisien
- Co-Distilasi: Penggunaan Llama 4 Behemoth sebagai model guru untuk model yang lebih kecil
- Pembelajaran online yang sepenuhnya asinkron dengan bala bantuan: infrastruktur baru untuk pembelajaran skala besar
Ketersediaan dan integrasi
Model LLAMA 4 tersedia melalui berbagai platform dan layanan:
Unduh dan penyedia cloud
- Model Scout dan Maverick dapat diunduh langsung dari meta atau melalui wajah memeluk
- Mereka juga tersedia melalui berbagai platform cloud:
- Pekerja Cloudflare AI
- Azure AI Foundry dan Azure Databricks
- Google Cloud's Vertex AI
- Mitra lain akan mengikuti dalam beberapa hari mendatang
Integrasi ke dalam produk meta
Meta telah memperbarui asisten AI -nya di berbagai platform di Llama 4:
- Whatsapp, messenger dan instagram langsung di 40 negara berbeda
- Situs web meta.ai
- Namun, fungsi multimodal saat ini hanya tersedia untuk pengguna bahasa Inggris di AS
Cocok untuk:
- Meta AI di Jerman ada di sini! Whatsapp, Instagram & Facebook Dapatkan AI-dengan perbedaan penting dalam versi AS
Lisensi dan Kontroversi
Meskipun meta llama 4 mengacu pada "open source", ada beberapa batasan dalam lisensi yang memicu kontroversi:
Pembatasan lisensi
Lisensi Komunitas Llama 4 berisi beberapa batasan:
- Perusahaan dengan lebih dari 700 juta pengguna aktif bulanan membutuhkan lisensi khusus dari Meta
- Model tampaknya tidak diizinkan untuk menggunakan atau mendistribusikan pengguna dan perusahaan dari UE, mungkin karena persyaratan peraturan
- Ada persyaratan tentang penamaan dan atribusi untuk model turunan
Debat tentang "open source"
Ada perdebatan tentang apakah Llama 4 harus benar -benar disebut "open source":
- Inisiatif Sumber Terbuka Ditemukan pada tahun 2023 bahwa pembatasan dalam lisensi Llama mengeluarkannya "dari kategori" Sumber Terbuka ""
- Kritikus berpendapat bahwa ini lebih merupakan model "sumber terbuka" atau "dengan bobot terbuka" daripada perangkat lunak sumber terbuka nyata
- Pembatasan lisensi bisa menjadi masalah bagi perusahaan kecil tanpa departemen hukum mereka sendiri
Rencana masa depan
Meta telah memberikan beberapa wawasan tentang rencana masa depannya untuk Llama 4 dan seterusnya:
Llamacon dan pengumuman lainnya
- Meta akan menyelenggarakan Konferensi Llamacon pertama pada tanggal 29 April 2025, di mana rincian lebih lanjut tentang model AI dan rencana produknya akan diumumkan
- Perusahaan juga berencana untuk menerbitkan aplikasi khusus untuk bot meta-obrolan di kuartal kedua
Perluasan Keterampilan Bahasa
- Meta sedang berupaya meningkatkan keterampilan bahasa Llama 4 untuk memungkinkan percakapan yang lebih alami
- Tujuannya adalah untuk mengaktifkan lebih banyak dialog dua sisi cairan di mana pengguna dapat mengganggu model AI
- Chris Cox, Kepala Petugas Produk Meta, menggambarkan Llama 4 yang akan datang sebagai "model omni" yang memungkinkan bahasa asli alih -alih menerjemahkan bahasa ke dalam teks
AI agen dan keterampilan yang diperluas
- Mark Zuckerberg telah mengumumkan bahwa Llama 4 akan memiliki "keterampilan agen" yang akan memungkinkan aplikasi baru
- Meta bertujuan untuk mengembangkan model AI yang “melakukan tindakan umum, tentu saja berkomunikasi dengan orang -orang dan memecahkan masalah yang menantang”
- Perusahaan sedang mempertimbangkan untuk menawarkan langganan premium untuk asisten AI untuk tujuan agen seperti reservasi atau produksi video
Mengapa Llama 4 adalah titik balik dalam lanskap AI
Publikasi Llama 4 merupakan langkah signifikan dalam strategi METAS untuk menjadi area terkemuka AI generatif di area yang sangat kompetitif. Dengan diperkenalkannya campuran arsitektur ahli, multimodality asli dan jendela konteks yang sangat panjang, meta menunjukkan bahwa model terbuka dapat mengikuti model eksklusif perusahaan teknologi besar.
Terlepas dari kontroversi tentang lisensi dan pertanyaan apakah Llama 4 harus benar -benar disebut sebagai "sumber terbuka", kemajuan teknis adalah tonggak penting. Kemampuan model untuk memproses teks dan gambar membuka peluang baru bagi pengembang dan perusahaan.
Dengan raksasa Llama 4 yang luar biasa dan rencana yang diumumkan untuk keterampilan bahasa dan agen yang diperluas, jelas bahwa Meta akan semakin mengintensifkan investasinya di AI. Bulan -bulan mendatang akan menunjukkan bagaimana model -model baru ini mengubah lanskap AI dan apakah, seperti yang diprediksi oleh Mark Zuckerberg, mereka sebenarnya akan membantu membuat model AI terbuka di bidang kecerdasan buatan.
Cocok untuk:
Mitra pemasaran global dan pengembangan bisnis Anda
☑️ Bahasa bisnis kami adalah Inggris atau Jerman
☑️ BARU: Korespondensi dalam bahasa nasional Anda!
Saya akan dengan senang hati melayani Anda dan tim saya sebagai penasihat pribadi.
Anda dapat menghubungi saya dengan mengisi formulir kontak atau cukup hubungi saya di +49 89 89 674 804 (Munich) . Alamat email saya adalah: wolfenstein ∂ xpert.digital
Saya menantikan proyek bersama kita.