⭐️ Artificiell intelligens (AI) - AI-blogg, hotspot och innehållsnav ⭐️ Digital intelligens ⭐️ XPaper

Röstval 📢

Meta släpper nya AI-modellserier Llama 4 Scout, Maverick och Behemoth

Publicerad den: 6 april 2025 / Uppdaterad den: 6 april 2025 – Författare: Konrad Wolfenstein

Meta släpper nya AI-modellserier Llama 4 Scout, Maverick och Behemoth – Bild: Xpert.Digital

Llama 4: Den nya generationen öppna AI-system från Meta

Llama 4 avslöjat: Metas nyckel till nästa AI-ålder

Den 5 april 2025 presenterade Meta den senaste generationen av sina AI-modeller, Llama 4. Dessa nya modeller representerar ett betydande framsteg i utvecklingen av öppna AI-system och har ett antal banbrytande funktioner som avsevärt förbättrar deras prestanda och effektivitet. Llama 4-serien består av flera modeller, varav två redan är allmänt tillgängliga, medan den kraftfullaste modellen fortfarande är i träningsfasen.

Lämplig för detta:

Enkelt förklarade AI-modeller: Förstå grunderna i AI, språkmodeller och resonemang

Llama 4-modellfamiljen

Meta har utvecklat tre olika modeller i Llama 4-serien, var och en optimerad för olika användningsområden:

Llama 4 Scout

Llama 4 Scout är en kompakt modell med imponerande tekniska specifikationer:

17 miljarder aktiva parametrar med 16 experter (totalt 109 miljarder parametrar)
Kan användas med en enda NVIDIA H100 GPU med Int4-kvantisering
Den har ett anmärkningsvärt stort kontextfönster på 10 miljoner tokens, vilket gör den till en av de första öppna modellerna med denna kapacitet

Enligt Meta överträffar Scout andra modeller i sin klass, såsom Gemini 3, Gemini 2.0 Flash-Lite och Mistral 3.1. Den är särskilt väl lämpad för uppgifter som att sammanfatta långa dokument, anpassa innehåll baserat på användardata och dra komplexa slutsatser från stora mängder kunskap.

Llama 4 Maverick

Llama 4 Maverick är den kraftfullaste av de två tillgängliga modellerna:

17 miljarder aktiva parametrar med 128 experter (totalt 400 miljarder parametrar)
Den experimentella chattversionen nådde ELO 1417 på LMArena
Enligt Meta överträffar den modeller som GPT-4o och Gemini 2.0 Flash i ett flertal riktmärken

Denna modell är särskilt lämplig för allmän assistans och chattapplikationer som kreativt skrivande och visar resultat jämförbara med DeepSeek v3 i resonemang och kodningsuppgifter, men med hälften så många parametrar.

Llama 4 Behemot

Llama 4 Behemoth är Metas kraftfullaste modell, men den är ännu inte allmänt tillgänglig:

288 miljarder aktiva parametrar med 16 experter (nästan 2 biljoner parametrar totalt)
Enligt Meta överträffar den GPT-4.5, Claude Sonnet 3.7 och Gemini 2.0 Pro i flera STEM-test
Fungerar som en "lärarmodell" för de mindre Llama 4-modellerna

Behemoth är för närvarande fortfarande i träningsfasen och kommer att släppas vid ett senare tillfälle.

Tekniska innovationer

Llama 4-modellserien introducerar flera betydande tekniska innovationer som förbättrar dess prestanda och effektivitet:

Arkitektur för expertmix (MoE)

En av de viktigaste innovationerna i Llama 4 är arkitekturen Mixture of Experts (MoE), där endast en delmängd av modellparametrarna aktiveras för varje token:

Detta minskar beräkningsansträngning och latens avsevärt, samtidigt som hög prestanda bibehålls
I Llama 4 Maverick bearbetas varje token av en delad expert och en av 128 dirigerade experter
Denna arkitektur gör det möjligt att öka modellens övergripande parametrar utan att öka inferenskostnaderna

Inbyggd multimodalitet med Early Fusion

Llama 4 är den första öppna modellen med inbyggd multimodalitet genom Early Fusion:

Text- och bildtokens är integrerade i en enhetlig modellarkitektur
Detta möjliggör gemensam förträning med stora mängder text-, bild- och videodata
Till skillnad från Llama 3.2, som använde separata parametrar för text och bilder, förstår Llama 4 båda modaliteterna direkt med samma parametrar

Extremt långt kontextfönster

Det extremt långa kontextfönstret i Llama 4 Scout är särskilt imponerande:

Med 10 miljoner tokens överträffar den avsevärt de flesta tillgängliga modeller
Detta möjliggör bearbetning av mycket långa dokument, hela kodbaser eller omfattande konversationer
iRoPE-arkitekturen (interleaved attention layers) gör detta möjligt

Nya träningsmetoder

Meta har använt flera innovativa metoder för att träna Llama 4:

MetaP: En teknik för robust finjustering av kritiska modellhyperparametrar
FP8-precision: Användning av 8-bitars flyttal för effektiv träning
Samdestillation: Användning av Llama 4 Behemoth som lärarmodell för mindre modeller
Helt asynkron onlineinlärning med förstärkning: En ny infrastruktur för storskaligt lärande

Tillgänglighet och integration

Llama 4-modellerna finns tillgängliga via olika plattformar och tjänster:

Nedladdnings- och molnleverantörer

Scout- och Maverick-modellerna kan laddas ner direkt från Meta eller via Hugging Face
De är också tillgängliga via olika molnplattformar:
- Cloudflare-arbetare AI
- Azure AI Foundry och Azure Databricks
- Google Clouds Vertex AI
- Fler partners kommer att följa under de kommande dagarna

Integrering i metaprodukter

Meta har redan uppdaterat sina AI-assistenter till Llama 4 på olika plattformar:

WhatsApp, Messenger och Instagram Direct i 40 olika länder
Meta.AI-webbplatsen
De multimodala funktionerna är dock för närvarande endast tillgängliga för engelsktalande användare i USA

Lämplig för detta:

Meta AI i Tyskland är här! WhatsApp, Instagram & Facebook Få AI-med viktiga skillnader i den amerikanska versionen

Licensiering och kontroverser

Även om Meta Llama 4 beskrivs som "öppen källkod" finns det vissa begränsningar i licensen som har skapat kontroverser:

Licensbegränsningar

Llama 4 Community-licensen innehåller flera begränsningar:

Företag med fler än 700 miljoner aktiva användare varje månad kräver en särskild licens från Meta
Användare och företag från EU får tydligen inte använda eller distribuera modellerna, förmodligen på grund av myndighetskrav
Det finns krav gällande namngivning och tillskrivning av härledda modeller

Debatt om "öppen källkod"

Det pågår en debatt om huruvida Llama 4 faktiskt borde kallas "Öppen källkod":

Open Source Initiative beslutade 2023 att restriktionerna i Llama-licensen tar den "ur kategorin 'Öppen källkod'"
Kritiker menar att det är mer av en "källkodsöppen" eller "öppna vikter"-modell än riktig öppen källkodsprogramvara
Licensbegränsningarna kan vara problematiska för småföretag utan egna juridiska avdelningar

Framtidsplaner

Meta har redan gett lite inblick i sina framtidsplaner för Llama 4 och framöver:

LlamaCon och andra tillkännagivanden

Meta kommer att vara värd för sin första LlamaCon-konferens den 29 april 2025, där ytterligare detaljer om deras AI-modeller och produktplaner kommer att tillkännages
Företaget planerar också att släppa en dedikerad applikation för sin metachatbot under andra kvartalet

Utöka språkkunskaperna

Meta arbetar med att förbättra Llama 4:s språkkunskaper för att möjliggöra mer naturliga samtal
Målet är att möjliggöra smidigare tvåvägsdialoger där användare kan avbryta AI-modellen
Chris Cox, produktchef på Meta, beskrev den kommande Llama 4 som en "omni-modell" som möjliggör modersmål istället för att översätta tal till text

Agent AI och förbättrade funktioner

Mark Zuckerberg har meddelat att Llama 4 kommer att ha "agentfunktioner" som möjliggör nya användningsområden
Meta syftar till att utveckla AI-modeller som kan "utföra generaliserade handlingar, kommunicera naturligt med människor och lösa utmanande problem"
Företaget överväger att erbjuda premiumprenumerationer för sin AI-assistent för agentrelaterade ändamål som bokningar eller videoproduktion

Varför Llama 4 är en vändpunkt i AI-landskapet

Lanseringen av Llama 4 representerar ett viktigt steg i Metas strategi att bli ledande inom det mycket konkurrensutsatta området generativ AI. Med introduktionen av Mixture of Experts-arkitekturen, nativ multimodalitet och ett imponerande långt kontextfönster visar Meta att öppna modeller kan konkurrera med de proprietära modellerna från stora teknikföretag.

Trots kontroverserna kring licensiering och frågan om huruvida Llama 4 verkligen borde kallas "öppen källkod", representerar de tekniska framstegen en betydande milstolpe. Modellernas förmåga att bearbeta både text och bilder öppnar upp nya möjligheter för utvecklare och företag.

Med Llama 4 Behemoth fortfarande under utveckling och de aviserade planerna för förbättrade språk- och agentfunktioner är det tydligt att Meta kommer att intensifiera sina investeringar i AI ytterligare. De kommande månaderna kommer att visa hur dessa nya modeller kommer att förändra AI-landskapet och om de verkligen, som Mark Zuckerberg förutspådde, kommer att hjälpa öppna AI-modeller att bli den ledande kraften inom artificiell intelligens.

Lämplig för detta: