Llama 4: Den nya generationen av öppna AI -system från META
Llama 4 avslöjade: Metas nyckeln till nästa AI -ålder
Meta presenterade den senaste generationen av sina AI -modeller, Llama 4, den 5 april 2025. Dessa nya modeller representerar betydande framsteg i utvecklingen av öppna AI -system och har ett antal banbrytande funktioner som väsentligt ökar deras prestanda och effektivitet. Llama 4 -serien består av olika modeller, med två av dem redan offentligt tillgängliga, medan den mest kraftfulla modellen fortfarande är i träningsfasen.
Lämplig för detta:
Llama 4 -modellfamiljen
Meta har utvecklat tre olika modeller i Llama 4 -serien, som var och en är optimerad för olika applikationer:
Lama 4 scout
Llama 4 Scout är en kompakt modell med imponerande tekniska specifikationer:
- 17 miljarder aktiva parametrar med 16 experter (totalt 109 miljarder parametrar)
- Kan drivas på en enda NVIDIA H100 GPU med INT4 -kvantisering
- Har ett anmärkningsvärt stort sammanhangsfönster på 10 miljoner symboler, vilket gör det till en av de första öppna modellerna med denna kapacitet
Enligt Meta överskrider Scout andra modeller i sin klass som Gemini 3, Gemini 2.0 Flash-Lite och Mistral 3.1. Det är särskilt lämpligt för uppgifter som sammanfattningen av långa dokument, personalisering baserad på användardata och komplexa slutsatser om stora mängder kunskap.
Lama 4 maverick
Llama 4 Maverick är den kraftfullare av de två tillgängliga modellerna:
- 17 miljarder aktiva parametrar med 128 experter (totalt 400 miljarder parametrar)
- Den experimentella chattversionen nådde Elo 1417 på LMarena
- Överskrider modeller som GPT-4O och Gemini 2.0 Flash i många riktmärken
Denna modell är särskilt lämplig för allmän hjälp och chattapplikationer som kreativt skrivande och visar resultat som är jämförbara med Deepseek V3 vid resonemang och kodningsuppgifter, men med hälften av parametrarna.
Lama 4 behemoth
Llama 4 Behemoth är Metas mest kraftfulla modell, som ännu inte är offentligt tillgänglig:
- 288 miljarder aktiva parametrar med 16 experter (totalt nästan 2 biljoner parametrar)
- Enligt Meta överskrider den GPT-4,5, Claude Sonnet 3.7 och Gemini 2.0 Pro för flera stammarknader
- Fungerar som en "lärarmodell" för de mindre Llama 4 -modellerna
Behemoth är för närvarande fortfarande i träningsfasen och kommer att publiceras vid ett senare tillfälle.
Tekniska innovationer
Llama 4 -modellserien introducerar flera viktiga tekniska innovationer som förbättrar deras prestanda och effektivitet:
Blandning av experter (MOE) arkitektur
En av de viktigaste innovationerna på Llama 4 är blandningen av experter (MOE) arkitektur, där endast en del av modellparametrarna aktiveras för varje symbol:
- Detta minskar avsevärt beräkningsinsatsen och latensen, medan den höga prestationen bevaras
- På Llama 4 Maverick behandlas varje symbol av en gemensam expert och en av 128 Geriserade experter
- Denna arkitektur gör det möjligt att öka modellens totala parameter utan att öka inferenskostnaderna
Native multimodalitet med tidig fusion
Llama 4 är den första öppna modellen med nativ multimodalitet genom tidig fusion:
- Text- och bildtokens är integrerade i en enhetlig modellarkitektur
- Detta möjliggör gemensam preliminär utbildning med stora mängder text, bild- och videodata
- Till skillnad från Llama 3.2, som använde separata parametrar för text och bilder, förstår Llama 4 båda metoderna med samma parametrar
Extremt långt sammanhangsfönster
Det extremt långa sammanhangsfönstret för Llama 4 Scout är särskilt imponerande:
- Med 10 miljoner symboler överstiger det tydligt de flesta av de tillgängliga modellerna
- Detta möjliggör behandling av mycket långa dokument, hela kodbaser eller omfattande samtal
- Irope -arkitekturen (sammanflätade uppmärksamhetslager) gör detta möjligt
Nya träningsmetoder
Meta har använt flera innovativa metoder för utbildning av Llama 4:
- Metap: En teknik för robust koordination av kritisk modellhyperameter
- FP8 Precision: Användning av 8-bitars glidgjorda nummer för effektiv träning
- Samföreställning: Användning av Llama 4 Behemoth som lärarmodell för mindre modeller
- Helt asynkron onlineinlärning med förstärkningar: En ny infrastruktur för storskalig lärande
Tillgänglighet och integration
Llama 4 -modellerna är tillgängliga via olika plattformar och tjänster:
Ladda ner och molnleverantör
- Models Scout och Maverick kan laddas ner direkt från Meta eller via kram Face
- De är också tillgängliga via olika molnplattformar:
- Cloudflare -arbetare ai
- Azure Ai Foundry och Azure Databricks
- Google Cloud's Vertex Ai
- Andra partners kommer att följa de kommande dagarna
Integration i metaprodukter
Meta har redan uppdaterat sina AI -assistenter på olika plattformar på Llama 4:
- WhatsApp, Messenger och Instagram direkt i 40 olika länder
- Meta.ai -webbplatsen
- Men de multimodala funktionerna är för närvarande endast tillgängliga för engelska språkanvändare i USA
Lämplig för detta:
- Meta AI i Tyskland är här! WhatsApp, Instagram & Facebook Få AI-med viktiga skillnader i den amerikanska versionen
Licens och kontroverser
Även om Meta Llama 4 hänvisar till "öppen källkod", finns det vissa begränsningar i licensen som utlöste kontrovers:
Licensbegränsningar
Llama 4 Community -licensen innehåller flera begränsningar:
- Företag med mer än 700 miljoner aktiva användare varje månad behöver en speciell licens från META
- Modellerna får uppenbarligen inte använda eller distribuera användare och företag från EU, förmodligen på grund av lagstiftningskrav
- Det finns krav på namngivning och tillskrivning för härledda modeller
Debatt om "Open Source"
Det diskuteras om Llama 4 faktiskt bör kallas ”öppen källkod”:
- Open Source -initiativet fann 2023 att begränsningarna i Llama -licensen tar ut den "från kategorin" Open Source ""
- Kritiker hävdar att det är mer av en "källöppen" eller "med öppna vikter" än riktig öppen källkodsprogramvara
- Licensbegränsningarna kan vara problematiska för små företag utan sina egna lagliga avdelningar
Framtida planer
Meta har redan gett lite insikt i sina framtida planer för Llama 4 och därefter:
Llamacon och andra tillkännagivanden
- Meta kommer att organisera den första Llamacon -konferensen den 29 april 2025, där ytterligare information om sina AI -modeller och produktplaner ska meddelas
- Företaget planerar också att publicera en dedikerad ansökan om sin Meta-Chat Bot under andra kvartalet
Utvidgning av språkkunskaper
- Meta arbetar med att förbättra Llama 4: s språkkunskaper för att möjliggöra mer naturliga samtal
- Målet är att möjliggöra mer flytande, tvåsidiga dialoger där användare kan avbryta AI-modellen
- Chris Cox, Chief Product Officer för Meta, beskrev den kommande Llama 4 som en "Omni -modell" som möjliggör modersmål istället för att översätta språk till text till text
Agentisk AI och utökade färdigheter
- Mark Zuckerberg har meddelat att Llama 4 kommer att ha "agentfärdigheter" som borde möjliggöra nya applikationer
- Meta syftar till att utveckla AI -modeller som "genomför generaliserade åtgärder, naturligtvis kommunicerar med människor och löser utmanande problem"
- Företaget överväger att erbjuda premiumabonnemang för sin AI -assistent för agentändamål som reservationer eller videoproduktion
Varför Llama 4 är en vändpunkt i AI -landskapet
Publiceringen av Llama 4 representerar ett betydande steg i Metas -strategin för att bli det ledande området för den generativa AI i det mycket konkurrenskraftiga området. Med introduktionen av blandningen av experterarkitektur, infödda multimodalitet och ett imponerande långt sammanhangsfönster visar Meta att öppna modeller kan hålla jämna steg med de egna modellerna för de stora teknikföretagen.
Trots kontroversen om licensieringen och frågan om Llama 4 verkligen bör kallas en "öppen källkod" är tekniska framsteg en viktig milstolpe. Modellernas förmåga att bearbeta både text och bilder öppnar nya möjligheter för utvecklare och företag.
Med den enastående Llama 4 Behemoth och de tillkännagivna planerna för utvidgade språk- och agentfärdigheter är det uppenbart att META ytterligare kommer att intensifiera sina investeringar i AI. De kommande månaderna kommer att visa hur dessa nya modeller förändrar AI -landskapet och om de, som förutses av Mark Zuckerberg, faktiskt kommer att hjälpa till att öppna AI -modeller inom konstgjord intelligens.
Lämplig för detta:
Din globala marknadsförings- och affärsutvecklingspartner
☑ Vårt affärsspråk är engelska eller tyska
☑ Nytt: korrespondens på ditt nationella språk!
Jag är glad att vara tillgänglig för dig och mitt team som personlig konsult.
Du kan kontakta mig genom att fylla i kontaktformuläret eller helt enkelt ringa mig på +49 89 674 804 (München) . Min e -postadress är: Wolfenstein ∂ xpert.digital
Jag ser fram emot vårt gemensamma projekt.