Publicerad den: 6 april 2025 / Uppdaterad den: 6 april 2025 – Författare: Konrad Wolfenstein
Llama 4: Den nya generationen öppna AI-system från Meta
Llama 4 avslöjat: Metas nyckel till nästa AI-ålder
Den 5 april 2025 presenterade Meta den senaste generationen av sina AI-modeller, Llama 4. Dessa nya modeller representerar ett betydande framsteg i utvecklingen av öppna AI-system och har ett antal banbrytande funktioner som avsevärt förbättrar deras prestanda och effektivitet. Llama 4-serien består av flera modeller, varav två redan är allmänt tillgängliga, medan den kraftfullaste modellen fortfarande är i träningsfasen.
Lämplig för detta:
Llama 4-modellfamiljen
Meta har utvecklat tre olika modeller i Llama 4-serien, var och en optimerad för olika användningsområden:
Llama 4 Scout
Llama 4 Scout är en kompakt modell med imponerande tekniska specifikationer:
- 17 miljarder aktiva parametrar med 16 experter (totalt 109 miljarder parametrar)
- Kan användas med en enda NVIDIA H100 GPU med Int4-kvantisering
- Den har ett anmärkningsvärt stort kontextfönster på 10 miljoner tokens, vilket gör den till en av de första öppna modellerna med denna kapacitet
Enligt Meta överträffar Scout andra modeller i sin klass, såsom Gemini 3, Gemini 2.0 Flash-Lite och Mistral 3.1. Den är särskilt väl lämpad för uppgifter som att sammanfatta långa dokument, anpassa innehåll baserat på användardata och dra komplexa slutsatser från stora mängder kunskap.
Llama 4 Maverick
Llama 4 Maverick är den kraftfullaste av de två tillgängliga modellerna:
- 17 miljarder aktiva parametrar med 128 experter (totalt 400 miljarder parametrar)
- Den experimentella chattversionen nådde ELO 1417 på LMArena
- Enligt Meta överträffar den modeller som GPT-4o och Gemini 2.0 Flash i ett flertal riktmärken
Denna modell är särskilt lämplig för allmän assistans och chattapplikationer som kreativt skrivande och visar resultat jämförbara med DeepSeek v3 i resonemang och kodningsuppgifter, men med hälften så många parametrar.
Llama 4 Behemot
Llama 4 Behemoth är Metas kraftfullaste modell, men den är ännu inte allmänt tillgänglig:
- 288 miljarder aktiva parametrar med 16 experter (nästan 2 biljoner parametrar totalt)
- Enligt Meta överträffar den GPT-4.5, Claude Sonnet 3.7 och Gemini 2.0 Pro i flera STEM-test
- Fungerar som en "lärarmodell" för de mindre Llama 4-modellerna
Behemoth är för närvarande fortfarande i träningsfasen och kommer att släppas vid ett senare tillfälle.
Tekniska innovationer
Llama 4-modellserien introducerar flera betydande tekniska innovationer som förbättrar dess prestanda och effektivitet:
Arkitektur för expertmix (MoE)
En av de viktigaste innovationerna i Llama 4 är arkitekturen Mixture of Experts (MoE), där endast en delmängd av modellparametrarna aktiveras för varje token:
- Detta minskar beräkningsansträngning och latens avsevärt, samtidigt som hög prestanda bibehålls
- I Llama 4 Maverick bearbetas varje token av en delad expert och en av 128 dirigerade experter
- Denna arkitektur gör det möjligt att öka modellens övergripande parametrar utan att öka inferenskostnaderna
Inbyggd multimodalitet med Early Fusion
Llama 4 är den första öppna modellen med inbyggd multimodalitet genom Early Fusion:
- Text- och bildtokens är integrerade i en enhetlig modellarkitektur
- Detta möjliggör gemensam förträning med stora mängder text-, bild- och videodata
- Till skillnad från Llama 3.2, som använde separata parametrar för text och bilder, förstår Llama 4 båda modaliteterna direkt med samma parametrar
Extremt långt kontextfönster
Det extremt långa kontextfönstret i Llama 4 Scout är särskilt imponerande:
- Med 10 miljoner tokens överträffar den avsevärt de flesta tillgängliga modeller
- Detta möjliggör bearbetning av mycket långa dokument, hela kodbaser eller omfattande konversationer
- iRoPE-arkitekturen (interleaved attention layers) gör detta möjligt
Nya träningsmetoder
Meta har använt flera innovativa metoder för att träna Llama 4:
- MetaP: En teknik för robust finjustering av kritiska modellhyperparametrar
- FP8-precision: Användning av 8-bitars flyttal för effektiv träning
- Samdestillation: Användning av Llama 4 Behemoth som lärarmodell för mindre modeller
- Helt asynkron onlineinlärning med förstärkning: En ny infrastruktur för storskaligt lärande
Tillgänglighet och integration
Llama 4-modellerna finns tillgängliga via olika plattformar och tjänster:
Nedladdnings- och molnleverantörer
- Scout- och Maverick-modellerna kan laddas ner direkt från Meta eller via Hugging Face
- De är också tillgängliga via olika molnplattformar:
- Cloudflare-arbetare AI
- Azure AI Foundry och Azure Databricks
- Google Clouds Vertex AI
- Fler partners kommer att följa under de kommande dagarna
Integrering i metaprodukter
Meta har redan uppdaterat sina AI-assistenter till Llama 4 på olika plattformar:
- WhatsApp, Messenger och Instagram Direct i 40 olika länder
- Meta.AI-webbplatsen
- De multimodala funktionerna är dock för närvarande endast tillgängliga för engelsktalande användare i USA
Lämplig för detta:
- Meta AI i Tyskland är här! WhatsApp, Instagram & Facebook Få AI-med viktiga skillnader i den amerikanska versionen
Licensiering och kontroverser
Även om Meta Llama 4 beskrivs som "öppen källkod" finns det vissa begränsningar i licensen som har skapat kontroverser:
Licensbegränsningar
Llama 4 Community-licensen innehåller flera begränsningar:
- Företag med fler än 700 miljoner aktiva användare varje månad kräver en särskild licens från Meta
- Användare och företag från EU får tydligen inte använda eller distribuera modellerna, förmodligen på grund av myndighetskrav
- Det finns krav gällande namngivning och tillskrivning av härledda modeller
Debatt om "öppen källkod"
Det pågår en debatt om huruvida Llama 4 faktiskt borde kallas "Öppen källkod":
- Open Source Initiative beslutade 2023 att restriktionerna i Llama-licensen tar den "ur kategorin 'Öppen källkod'"
- Kritiker menar att det är mer av en "källkodsöppen" eller "öppna vikter"-modell än riktig öppen källkodsprogramvara
- Licensbegränsningarna kan vara problematiska för småföretag utan egna juridiska avdelningar
Framtidsplaner
Meta har redan gett lite inblick i sina framtidsplaner för Llama 4 och framöver:
LlamaCon och andra tillkännagivanden
- Meta kommer att vara värd för sin första LlamaCon-konferens den 29 april 2025, där ytterligare detaljer om deras AI-modeller och produktplaner kommer att tillkännages
- Företaget planerar också att släppa en dedikerad applikation för sin metachatbot under andra kvartalet
Utöka språkkunskaperna
- Meta arbetar med att förbättra Llama 4:s språkkunskaper för att möjliggöra mer naturliga samtal
- Målet är att möjliggöra smidigare tvåvägsdialoger där användare kan avbryta AI-modellen
- Chris Cox, produktchef på Meta, beskrev den kommande Llama 4 som en "omni-modell" som möjliggör modersmål istället för att översätta tal till text
Agent AI och förbättrade funktioner
- Mark Zuckerberg har meddelat att Llama 4 kommer att ha "agentfunktioner" som möjliggör nya användningsområden
- Meta syftar till att utveckla AI-modeller som kan "utföra generaliserade handlingar, kommunicera naturligt med människor och lösa utmanande problem"
- Företaget överväger att erbjuda premiumprenumerationer för sin AI-assistent för agentrelaterade ändamål som bokningar eller videoproduktion
Varför Llama 4 är en vändpunkt i AI-landskapet
Lanseringen av Llama 4 representerar ett viktigt steg i Metas strategi att bli ledande inom det mycket konkurrensutsatta området generativ AI. Med introduktionen av Mixture of Experts-arkitekturen, nativ multimodalitet och ett imponerande långt kontextfönster visar Meta att öppna modeller kan konkurrera med de proprietära modellerna från stora teknikföretag.
Trots kontroverserna kring licensiering och frågan om huruvida Llama 4 verkligen borde kallas "öppen källkod", representerar de tekniska framstegen en betydande milstolpe. Modellernas förmåga att bearbeta både text och bilder öppnar upp nya möjligheter för utvecklare och företag.
Med Llama 4 Behemoth fortfarande under utveckling och de aviserade planerna för förbättrade språk- och agentfunktioner är det tydligt att Meta kommer att intensifiera sina investeringar i AI ytterligare. De kommande månaderna kommer att visa hur dessa nya modeller kommer att förändra AI-landskapet och om de verkligen, som Mark Zuckerberg förutspådde, kommer att hjälpa öppna AI-modeller att bli den ledande kraften inom artificiell intelligens.
Lämplig för detta:
Din globala marknadsförings- och affärsutvecklingspartner
☑ Vårt affärsspråk är engelska eller tyska
☑ Nytt: korrespondens på ditt nationella språk!
Jag är glad att vara tillgänglig för dig och mitt team som personlig konsult.
Du kan kontakta mig genom att fylla i kontaktformuläret eller helt enkelt ringa mig på +49 89 674 804 (München) . Min e -postadress är: Wolfenstein ∂ xpert.digital
Jag ser fram emot vårt gemensamma projekt.














