Dil seçimi 📢


Meta yeni Llama 4 İzci, Maverick ve Behemoth yayınladı

Yayınlanan: 6 Nisan 2025 / Güncelleme: 6 Nisan 2025 - Yazar: Konrad Wolfenstein

Meta yeni Llama 4 İzci, Maverick ve Behemoth yayınladı

Meta yeni Llama 4 Scout, Maverick ve Behemoth-Image yayınladı: Xpert.digital

Lama 4: Meta'dan yeni nesil açık AI sistemleri

Lama 4 Açıklandı: Bir sonraki AI Çağının Metas Anahtarı

Meta, 5 Nisan 2025'te AI modellerinin en yeni nesli Lama 4'ü sundu. Bu yeni modeller, açık AI sistemlerinin geliştirilmesinde önemli ilerlemeyi temsil ediyor ve performanslarını ve verimliliğini önemli ölçüde artıran bir dizi çığır açan işlevi var. Llama 4 serisi farklı modellerden oluşur, ikisi halka açık olarak mevcuttur, en güçlü model hala eğitim aşamasındadır.

İçin uygun:

Lama 4 Model Ailesi

Meta, Lama 4 serisinde her biri farklı uygulamalar için optimize edilmiş üç farklı model geliştirdi:

Lama 4 İzci

Lama 4 Scout, etkileyici teknik özelliklere sahip kompakt bir modeldir:

  • 16 uzmanla 17 milyar aktif parametre (toplam 109 milyar parametre)
  • Int4 nicelleştirme ile tek bir NVIDIA H100 GPU'da çalıştırılabilir
  • 10 milyon jetonun son derece büyük bir bağlam penceresine sahiptir, bu da onu bu kapasiteye sahip ilk açık modellerden biri haline getirir

Meta'ya göre Scout, sınıfında Gemini 3, Gemini 2.0 Flash-Lite ve Mistral 3.1 gibi diğer modelleri aşıyor. Özellikle uzun belgelerin özeti, kullanıcı verilerine dayalı kişiselleştirme ve büyük miktarda bilgi ile ilgili karmaşık sonuçlar gibi görevler için uygundur.

Lama 4 Maverick

Lama 4 Maverick, mevcut iki modelden daha güçlüdür:

  • 128 uzmanla 17 milyar aktif parametre (toplam 400 milyar parametre)
  • Deneysel sohbet versiyonu Lmarena'da ELO 1417'ye ulaştı
  • GPT-4O ve Gemini 2.0 flaşı gibi modelleri çok sayıda ölçütle aşıyor

Bu model özellikle yaratıcı yazma gibi genel yardım ve sohbet uygulamaları için uygundur ve akıl yürütme ve kodlama görevlerinde Deepseek V3 ile karşılaştırılabilir sonuçları gösterir, ancak parametrelerin yarısıdır.

Lama 4 Behemoth

Lama 4 Behemoth, Metas'ın henüz halka açık olmayan en güçlü modelidir:

  • 16 uzmanla 288 milyar aktif parametre (toplam 2 trilyon parametre)
  • Meta'ya göre, GPT-4.5'i, Claude Sonnet 3.7'yi ve Gemini 2.0 Pro'yu birkaç STEM kriter için aşıyor
  • Daha küçük Llama 4 modelleri için bir “öğretmen modeli” görevi görür

Behemoth şu anda hala eğitim aşamasında ve daha sonraki bir tarihte yayınlanacak.

Teknik Yenilikler

Llama 4 Model Serisi, performanslarını ve verimliliğini artıran birkaç önemli teknik yenilik sunuyor:

Uzmanlar (MOE) mimarisi karışımı

Lama 4'teki en önemli yeniliklerden biri, her jeton için model parametrelerinin sadece bir kısmının etkinleştirildiği Uzmanlar (MOE) mimarisinin karışımıdır:

  • Bu, yüksek performans korunurken, hesaplama çabasını ve gecikmeyi önemli ölçüde azaltır
  • Lama 4 Maverick'te, her jeton ortak bir uzman ve 128 gerizleştirilmiş uzmandan biri tarafından işlenir
  • Bu mimari, çıkarım maliyetlerini artırmadan modelin toplam parametresini artırmayı mümkün kılar

Erken füzyon ile doğal multimodalite

Lama 4, erken füzyonla yerel multimodaliteli ilk açık modeldir:

  • Metin ve görüntü jetonları tek tip bir model mimariye entegre edilmiştir
  • Bu, büyük miktarlarda metin, görüntü ve video verisi ile ortak ön eğitim sağlar
  • Metin ve görüntüler için ayrı parametreler kullanan Llama 3.2'nin aksine, Lama 4 her iki modaliteyi de aynı parametrelerle anlıyor

Son derece uzun bağlam penceresi

Lama 4 İzci'nin son derece uzun bağlam penceresi özellikle etkileyici:

  • 10 milyon jetonla, mevcut modellerin çoğunu açıkça aşıyor
  • Bu, çok uzun belgelerin, tüm kod tabanlarının veya kapsamlı konuşmaların işlenmesini sağlar
  • Irope mimarisi (birbirine bağlı dikkat katmanları) bunu mümkün kılar

Yeni Eğitim Yöntemleri

Meta, Lama 4'ün eğitimi için birkaç yenilikçi yöntem kullandı:

  • Metap: Kritik model hiperametrenin sağlam koordinasyonu için bir teknik
  • FP8 hassasiyeti: Verimli eğitim için 8 bit slayt yapımı sayıların kullanımı
  • Ortak Distilasyon: Daha küçük modeller için bir öğretmen modeli olarak Lama 4 Behemoth kullanımı
  • Takviye ile tamamen eşzamansız çevrimiçi öğrenme: Büyük ölçekli öğrenme için yeni bir altyapı

Kullanılabilirlik ve entegrasyon

Lama 4 modelleri çeşitli platformlar ve hizmetler aracılığıyla mevcuttur:

İndir ve Bulut Sağlayıcısı

  • Modeller Scout ve Maverick doğrudan meta veya sarılma yüzünden indirilebilir
  • Ayrıca çeşitli bulut platformları aracılığıyla da mevcuttur:
    • Cloudflare işçileri AI
    • Azure AI Döküm ve Azure Databricks
    • Google Cloud'un Vertex AI
    • Önümüzdeki günlerde diğer ortaklar takip edecek

Meta ürünlerine entegrasyon

Meta, AI asistanlarını Lama 4'teki çeşitli platformlarda güncelledi:

  • 40 farklı ülkede Whatsapp, Messenger ve Instagram doğrudan
  • Meta.ai web sitesi
  • Bununla birlikte, multimodal işlevler şu anda yalnızca ABD'deki İngilizce -dil kullanıcıları için kullanılabilir

İçin uygun:

Lisans ve Tartışma

Meta Llama 4 “açık kaynak” anlamına gelse de, lisansta tartışmayı tetikleyen bazı kısıtlamalar vardır:

Lisans Kısıtlamaları

Llama 4 topluluk lisansı birkaç kısıtlama içerir:

  • Aylık 700 milyondan fazla aktif kullanıcıya sahip şirketlerin Meta'dan özel bir lisansa ihtiyacı var
  • Modellerin, muhtemelen düzenleyici gereksinimler nedeniyle AB'den kullanıcıları ve şirketleri kullanmasına veya dağıtmasına izin verilmiyor.
  • Türetilmiş modeller için adlandırma ve ilişkilendirme ile ilgili gereksinimler vardır

"Açık Kaynak" hakkında tartışma

Lama 4'ün aslında “açık kaynak” olarak adlandırılmayacağı konusunda bir tartışma var:

  • Açık Kaynak Girişimi, 2023 yılında Lama Lisansındaki kısıtlamaların onu “'Açık Kaynak'” kategorisinden çıkardığını tespit etti
  • Eleştirmenler, bunun gerçek açık kaynaklı yazılımdan daha “kaynak açık” veya “açık ağırlıklarla” modeli olduğunu savunuyorlar
  • Lisans kısıtlamaları, kendi hukuk departmanları olmayan küçük şirketler için sorunlu olabilir

Gelecek Planları

Meta, Lama 4 ve ötesi için gelecek planları hakkında zaten bazı bilgiler verdi:

Llamacon ve diğer duyurular

  • Meta, 29 Nisan 2025'te AI modelleri ve ürün planları hakkında daha fazla ayrıntının açıklanacağı ilk Llamacon Konferansı'nı düzenleyecek
  • Şirket ayrıca ikinci çeyrekte meta-chat botu için özel bir başvuru yayınlamayı planlıyor

Dil becerilerinin genişlemesi

  • Meta, daha fazla doğal sohbet sağlamak için Lama 4'ün dil becerilerini geliştirmeye çalışıyor
  • Amaç, kullanıcıların AI modelini kesintiye uğratabileceği daha fazla akıcı, iki taraflı diyalog sağlamaktır.
  • Meta'nın baş ürün sorumlusu Chris Cox, yaklaşmakta olan Llama 4'ü, dili metne çevirmek yerine ana dili sağlayan bir “omni modeli” olarak nitelendirdi.

Ajanik AI ve Genişletilmiş Beceriler

  • Mark Zuckerberg, Lama 4'ün yeni uygulamalar sağlayacak “ajan becerileri” olacağını duyurdu
  • Meta, "genelleştirilmiş eylemler gerçekleştiren, elbette insanlarla iletişim kuran ve zorlu sorunları çözen" yapay zeka modelleri geliştirmeyi amaçlamaktadır.
  • Şirket, rezervasyon veya video prodüksiyonu gibi AI asistanı için premium abonelikler sunmayı düşünüyor

Neden Lama 4 AI manzarasında bir dönüm noktası

Lama 4'ün yayınlanması, yüksek rekabetçi alanda üretken AI'nın önde gelen alanı olmak için Metas stratejisinde önemli bir adımdır. Uzmanlar mimarisi, yerli multimodalite ve etkileyici uzun bir bağlam penceresinin karışımının piyasaya sürülmesiyle Meta, açık modellerin büyük teknoloji şirketlerinin tescilli modellerine ayak uydurabileceğini gösteriyor.

Lemanlama ve Lama 4'ün gerçekten “açık kaynak” olarak adlandırılması gerekip gerekmediği sorusuyla ilgili tartışmalara rağmen, teknik ilerleme önemli bir kilometre taşıdır. Modellerin hem metin hem de görüntüleri işleme yeteneği, geliştiriciler ve şirketler için yeni fırsatlar açar.

Olağanüstü Llama 4 Behemoth ve genişletilmiş dil ve ajan becerileri için açıklanan planlarla, Meta'nın AI'daki yatırımlarını daha da yoğunlaştıracağı açıktır. Önümüzdeki aylar, bu yeni modellerin AI manzarasını nasıl değiştirdiğini ve Mark Zuckerberg tarafından tahmin edildiği gibi, aslında yapay zeka alanında açık AI modelleri yapmaya yardımcı olup olmayacaklarını gösterecek.

İçin uygun:

 

Küresel pazarlama ve iş geliştirme ortağınız

☑️İş dilimiz İngilizce veya Almancadır

☑️ YENİ: Ulusal dilinizde yazışmalar!

 

Dijital Öncü - Konrad Wolfenstein

Konrad Wolfenstein

Size ve ekibime kişisel danışman olarak hizmet etmekten mutluluk duyarım.

iletişim formunu doldurarak benimle iletişime geçebilir +49 89 89 674 804 (Münih) numaralı telefondan beni arayabilirsiniz . E-posta adresim: wolfenstein xpert.digital

Ortak projemizi sabırsızlıkla bekliyorum.

 

 

☑️ Strateji, danışmanlık, planlama ve uygulama konularında KOBİ desteği

☑️ Dijital stratejinin ve dijitalleşmenin oluşturulması veya yeniden düzenlenmesi

☑️ Uluslararası satış süreçlerinin genişletilmesi ve optimizasyonu

☑️ Küresel ve Dijital B2B ticaret platformları

☑️ Öncü İş Geliştirme / Pazarlama / Halkla İlişkiler / Fuarlar


⭐️ Yapay Zeka (AI) -Ai Blog, Hotspot ve Content Hub   ⭐️ Dijital Zeka