⭐ Artificial Intelligence (AI) -AI-blogg, hotspot och innehållsnav ⭐ Digital intelligens ⭐ Xpaper

Röstval 📢

Meta publicerar New Llama 4 Scout, Maverick och Behemoth

Publicerad: 6 april 2025 / UPDATE Från: 6 april 2025 - Författare: Konrad Wolfenstein

Meta publicerar New Lama 4 Scout, Maverick och Behemoth-Image: Xpert.Digital

Llama 4: Den nya generationen av öppna AI -system från META

Llama 4 avslöjade: Metas nyckeln till nästa AI -ålder

Meta presenterade den senaste generationen av sina AI -modeller, Llama 4, den 5 april 2025. Dessa nya modeller representerar betydande framsteg i utvecklingen av öppna AI -system och har ett antal banbrytande funktioner som väsentligt ökar deras prestanda och effektivitet. Llama 4 -serien består av olika modeller, med två av dem redan offentligt tillgängliga, medan den mest kraftfulla modellen fortfarande är i träningsfasen.

Lämplig för detta:

Helt enkelt förklarade AI -modeller: förstå grunderna i AI, röstmodeller och resonemang

Llama 4 -modellfamiljen

Meta har utvecklat tre olika modeller i Llama 4 -serien, som var och en är optimerad för olika applikationer:

Lama 4 scout

Llama 4 Scout är en kompakt modell med imponerande tekniska specifikationer:

17 miljarder aktiva parametrar med 16 experter (totalt 109 miljarder parametrar)
Kan drivas på en enda NVIDIA H100 GPU med INT4 -kvantisering
Har ett anmärkningsvärt stort sammanhangsfönster på 10 miljoner symboler, vilket gör det till en av de första öppna modellerna med denna kapacitet

Enligt Meta överskrider Scout andra modeller i sin klass som Gemini 3, Gemini 2.0 Flash-Lite och Mistral 3.1. Det är särskilt lämpligt för uppgifter som sammanfattningen av långa dokument, personalisering baserad på användardata och komplexa slutsatser om stora mängder kunskap.

Lama 4 maverick

Llama 4 Maverick är den kraftfullare av de två tillgängliga modellerna:

17 miljarder aktiva parametrar med 128 experter (totalt 400 miljarder parametrar)
Den experimentella chattversionen nådde Elo 1417 på LMarena
Överskrider modeller som GPT-4O och Gemini 2.0 Flash i många riktmärken

Denna modell är särskilt lämplig för allmän hjälp och chattapplikationer som kreativt skrivande och visar resultat som är jämförbara med Deepseek V3 vid resonemang och kodningsuppgifter, men med hälften av parametrarna.

Lama 4 behemoth

Llama 4 Behemoth är Metas mest kraftfulla modell, som ännu inte är offentligt tillgänglig:

288 miljarder aktiva parametrar med 16 experter (totalt nästan 2 biljoner parametrar)
Enligt Meta överskrider den GPT-4,5, Claude Sonnet 3.7 och Gemini 2.0 Pro för flera stammarknader
Fungerar som en "lärarmodell" för de mindre Llama 4 -modellerna

Behemoth är för närvarande fortfarande i träningsfasen och kommer att publiceras vid ett senare tillfälle.

Tekniska innovationer

Llama 4 -modellserien introducerar flera viktiga tekniska innovationer som förbättrar deras prestanda och effektivitet:

Blandning av experter (MOE) arkitektur

En av de viktigaste innovationerna på Llama 4 är blandningen av experter (MOE) arkitektur, där endast en del av modellparametrarna aktiveras för varje symbol:

Detta minskar avsevärt beräkningsinsatsen och latensen, medan den höga prestationen bevaras
På Llama 4 Maverick behandlas varje symbol av en gemensam expert och en av 128 Geriserade experter
Denna arkitektur gör det möjligt att öka modellens totala parameter utan att öka inferenskostnaderna

Native multimodalitet med tidig fusion

Llama 4 är den första öppna modellen med nativ multimodalitet genom tidig fusion:

Text- och bildtokens är integrerade i en enhetlig modellarkitektur
Detta möjliggör gemensam preliminär utbildning med stora mängder text, bild- och videodata
Till skillnad från Llama 3.2, som använde separata parametrar för text och bilder, förstår Llama 4 båda metoderna med samma parametrar

Extremt långt sammanhangsfönster

Det extremt långa sammanhangsfönstret för Llama 4 Scout är särskilt imponerande:

Med 10 miljoner symboler överstiger det tydligt de flesta av de tillgängliga modellerna
Detta möjliggör behandling av mycket långa dokument, hela kodbaser eller omfattande samtal
Irope -arkitekturen (sammanflätade uppmärksamhetslager) gör detta möjligt

Nya träningsmetoder

Meta har använt flera innovativa metoder för utbildning av Llama 4:

Metap: En teknik för robust koordination av kritisk modellhyperameter
FP8 Precision: Användning av 8-bitars glidgjorda nummer för effektiv träning
Samföreställning: Användning av Llama 4 Behemoth som lärarmodell för mindre modeller
Helt asynkron onlineinlärning med förstärkningar: En ny infrastruktur för storskalig lärande

Tillgänglighet och integration

Llama 4 -modellerna är tillgängliga via olika plattformar och tjänster:

Ladda ner och molnleverantör

Models Scout och Maverick kan laddas ner direkt från Meta eller via kram Face
De är också tillgängliga via olika molnplattformar:
- Cloudflare -arbetare ai
- Azure Ai Foundry och Azure Databricks
- Google Cloud's Vertex Ai
- Andra partners kommer att följa de kommande dagarna

Integration i metaprodukter

Meta har redan uppdaterat sina AI -assistenter på olika plattformar på Llama 4:

WhatsApp, Messenger och Instagram direkt i 40 olika länder
Meta.ai -webbplatsen
Men de multimodala funktionerna är för närvarande endast tillgängliga för engelska språkanvändare i USA

Lämplig för detta:

Meta AI i Tyskland är här! WhatsApp, Instagram & Facebook Få AI-med viktiga skillnader i den amerikanska versionen

Licens och kontroverser

Även om Meta Llama 4 hänvisar till "öppen källkod", finns det vissa begränsningar i licensen som utlöste kontrovers:

Licensbegränsningar

Llama 4 Community -licensen innehåller flera begränsningar:

Företag med mer än 700 miljoner aktiva användare varje månad behöver en speciell licens från META
Modellerna får uppenbarligen inte använda eller distribuera användare och företag från EU, förmodligen på grund av lagstiftningskrav
Det finns krav på namngivning och tillskrivning för härledda modeller

Debatt om "Open Source"

Det diskuteras om Llama 4 faktiskt bör kallas ”öppen källkod”:

Open Source -initiativet fann 2023 att begränsningarna i Llama -licensen tar ut den "från kategorin" Open Source ""
Kritiker hävdar att det är mer av en "källöppen" eller "med öppna vikter" än riktig öppen källkodsprogramvara
Licensbegränsningarna kan vara problematiska för små företag utan sina egna lagliga avdelningar

Framtida planer

Meta har redan gett lite insikt i sina framtida planer för Llama 4 och därefter:

Llamacon och andra tillkännagivanden

Meta kommer att organisera den första Llamacon -konferensen den 29 april 2025, där ytterligare information om sina AI -modeller och produktplaner ska meddelas
Företaget planerar också att publicera en dedikerad ansökan om sin Meta-Chat Bot under andra kvartalet

Utvidgning av språkkunskaper

Meta arbetar med att förbättra Llama 4: s språkkunskaper för att möjliggöra mer naturliga samtal
Målet är att möjliggöra mer flytande, tvåsidiga dialoger där användare kan avbryta AI-modellen
Chris Cox, Chief Product Officer för Meta, beskrev den kommande Llama 4 som en "Omni -modell" som möjliggör modersmål istället för att översätta språk till text till text

Agentisk AI och utökade färdigheter

Mark Zuckerberg har meddelat att Llama 4 kommer att ha "agentfärdigheter" som borde möjliggöra nya applikationer
Meta syftar till att utveckla AI -modeller som "genomför generaliserade åtgärder, naturligtvis kommunicerar med människor och löser utmanande problem"
Företaget överväger att erbjuda premiumabonnemang för sin AI -assistent för agentändamål som reservationer eller videoproduktion

Varför Llama 4 är en vändpunkt i AI -landskapet

Publiceringen av Llama 4 representerar ett betydande steg i Metas -strategin för att bli det ledande området för den generativa AI i det mycket konkurrenskraftiga området. Med introduktionen av blandningen av experterarkitektur, infödda multimodalitet och ett imponerande långt sammanhangsfönster visar Meta att öppna modeller kan hålla jämna steg med de egna modellerna för de stora teknikföretagen.

Trots kontroversen om licensieringen och frågan om Llama 4 verkligen bör kallas en "öppen källkod" är tekniska framsteg en viktig milstolpe. Modellernas förmåga att bearbeta både text och bilder öppnar nya möjligheter för utvecklare och företag.

Med den enastående Llama 4 Behemoth och de tillkännagivna planerna för utvidgade språk- och agentfärdigheter är det uppenbart att META ytterligare kommer att intensifiera sina investeringar i AI. De kommande månaderna kommer att visa hur dessa nya modeller förändrar AI -landskapet och om de, som förutses av Mark Zuckerberg, faktiskt kommer att hjälpa till att öppna AI -modeller inom konstgjord intelligens.

Lämplig för detta: