Webbplatsikon Xpert.digital

Meta släpper nya AI-modellserier Llama 4 Scout, Maverick och Behemoth

Meta släpper nya AI-modellserier Llama 4 Scout, Maverick och Behemoth

Meta släpper nya AI-modellserier Llama 4 Scout, Maverick och Behemoth – Bild: Xpert.Digital

Llama 4: Den nya generationen öppna AI-system från Meta

Llama 4 avslöjat: Metas nyckel till nästa AI-ålder

Den 5 april 2025 presenterade Meta den senaste generationen av sina AI-modeller, Llama 4. Dessa nya modeller representerar ett betydande framsteg i utvecklingen av öppna AI-system och har ett antal banbrytande funktioner som avsevärt förbättrar deras prestanda och effektivitet. Llama 4-serien består av flera modeller, varav två redan är allmänt tillgängliga, medan den kraftfullaste modellen fortfarande är i träningsfasen.

Lämplig för detta:

Llama 4-modellfamiljen

Meta har utvecklat tre olika modeller i Llama 4-serien, var och en optimerad för olika användningsområden:

Llama 4 Scout

Llama 4 Scout är en kompakt modell med imponerande tekniska specifikationer:

  • 17 miljarder aktiva parametrar med 16 experter (totalt 109 miljarder parametrar)
  • Kan användas med en enda NVIDIA H100 GPU med Int4-kvantisering
  • Den har ett anmärkningsvärt stort kontextfönster på 10 miljoner tokens, vilket gör den till en av de första öppna modellerna med denna kapacitet

Enligt Meta överträffar Scout andra modeller i sin klass, såsom Gemini 3, Gemini 2.0 Flash-Lite och Mistral 3.1. Den är särskilt väl lämpad för uppgifter som att sammanfatta långa dokument, anpassa innehåll baserat på användardata och dra komplexa slutsatser från stora mängder kunskap.

Llama 4 Maverick

Llama 4 Maverick är den kraftfullaste av de två tillgängliga modellerna:

  • 17 miljarder aktiva parametrar med 128 experter (totalt 400 miljarder parametrar)
  • Den experimentella chattversionen nådde ELO 1417 på LMArena
  • Enligt Meta överträffar den modeller som GPT-4o och Gemini 2.0 Flash i ett flertal riktmärken

Denna modell är särskilt lämplig för allmän assistans och chattapplikationer som kreativt skrivande och visar resultat jämförbara med DeepSeek v3 i resonemang och kodningsuppgifter, men med hälften så många parametrar.

Llama 4 Behemot

Llama 4 Behemoth är Metas kraftfullaste modell, men den är ännu inte allmänt tillgänglig:

  • 288 miljarder aktiva parametrar med 16 experter (nästan 2 biljoner parametrar totalt)
  • Enligt Meta överträffar den GPT-4.5, Claude Sonnet 3.7 och Gemini 2.0 Pro i flera STEM-test
  • Fungerar som en "lärarmodell" för de mindre Llama 4-modellerna

Behemoth är för närvarande fortfarande i träningsfasen och kommer att släppas vid ett senare tillfälle.

Tekniska innovationer

Llama 4-modellserien introducerar flera betydande tekniska innovationer som förbättrar dess prestanda och effektivitet:

Arkitektur för expertmix (MoE)

En av de viktigaste innovationerna i Llama 4 är arkitekturen Mixture of Experts (MoE), där endast en delmängd av modellparametrarna aktiveras för varje token:

  • Detta minskar beräkningsansträngning och latens avsevärt, samtidigt som hög prestanda bibehålls
  • I Llama 4 Maverick bearbetas varje token av en delad expert och en av 128 dirigerade experter
  • Denna arkitektur gör det möjligt att öka modellens övergripande parametrar utan att öka inferenskostnaderna

Inbyggd multimodalitet med Early Fusion

Llama 4 är den första öppna modellen med inbyggd multimodalitet genom Early Fusion:

  • Text- och bildtokens är integrerade i en enhetlig modellarkitektur
  • Detta möjliggör gemensam förträning med stora mängder text-, bild- och videodata
  • Till skillnad från Llama 3.2, som använde separata parametrar för text och bilder, förstår Llama 4 båda modaliteterna direkt med samma parametrar

Extremt långt kontextfönster

Det extremt långa kontextfönstret i Llama 4 Scout är särskilt imponerande:

  • Med 10 miljoner tokens överträffar den avsevärt de flesta tillgängliga modeller
  • Detta möjliggör bearbetning av mycket långa dokument, hela kodbaser eller omfattande konversationer
  • iRoPE-arkitekturen (interleaved attention layers) gör detta möjligt

Nya träningsmetoder

Meta har använt flera innovativa metoder för att träna Llama 4:

  • MetaP: En teknik för robust finjustering av kritiska modellhyperparametrar
  • FP8-precision: Användning av 8-bitars flyttal för effektiv träning
  • Samdestillation: Användning av Llama 4 Behemoth som lärarmodell för mindre modeller
  • Helt asynkron onlineinlärning med förstärkning: En ny infrastruktur för storskaligt lärande

Tillgänglighet och integration

Llama 4-modellerna finns tillgängliga via olika plattformar och tjänster:

Nedladdnings- och molnleverantörer

  • Scout- och Maverick-modellerna kan laddas ner direkt från Meta eller via Hugging Face
  • De är också tillgängliga via olika molnplattformar:
    • Cloudflare-arbetare AI
    • Azure AI Foundry och Azure Databricks
    • Google Clouds Vertex AI
    • Fler partners kommer att följa under de kommande dagarna

Integrering i metaprodukter

Meta har redan uppdaterat sina AI-assistenter till Llama 4 på olika plattformar:

  • WhatsApp, Messenger och Instagram Direct i 40 olika länder
  • Meta.AI-webbplatsen
  • De multimodala funktionerna är dock för närvarande endast tillgängliga för engelsktalande användare i USA

Lämplig för detta:

Licensiering och kontroverser

Även om Meta Llama 4 beskrivs som "öppen källkod" finns det vissa begränsningar i licensen som har skapat kontroverser:

Licensbegränsningar

Llama 4 Community-licensen innehåller flera begränsningar:

  • Företag med fler än 700 miljoner aktiva användare varje månad kräver en särskild licens från Meta
  • Användare och företag från EU får tydligen inte använda eller distribuera modellerna, förmodligen på grund av myndighetskrav
  • Det finns krav gällande namngivning och tillskrivning av härledda modeller

Debatt om "öppen källkod"

Det pågår en debatt om huruvida Llama 4 faktiskt borde kallas "Öppen källkod":

  • Open Source Initiative beslutade 2023 att restriktionerna i Llama-licensen tar den "ur kategorin 'Öppen källkod'"
  • Kritiker menar att det är mer av en "källkodsöppen" eller "öppna vikter"-modell än riktig öppen källkodsprogramvara
  • Licensbegränsningarna kan vara problematiska för småföretag utan egna juridiska avdelningar

Framtidsplaner

Meta har redan gett lite inblick i sina framtidsplaner för Llama 4 och framöver:

LlamaCon och andra tillkännagivanden

  • Meta kommer att vara värd för sin första LlamaCon-konferens den 29 april 2025, där ytterligare detaljer om deras AI-modeller och produktplaner kommer att tillkännages
  • Företaget planerar också att släppa en dedikerad applikation för sin metachatbot under andra kvartalet

Utöka språkkunskaperna

  • Meta arbetar med att förbättra Llama 4:s språkkunskaper för att möjliggöra mer naturliga samtal
  • Målet är att möjliggöra smidigare tvåvägsdialoger där användare kan avbryta AI-modellen
  • Chris Cox, produktchef på Meta, beskrev den kommande Llama 4 som en "omni-modell" som möjliggör modersmål istället för att översätta tal till text

Agent AI och förbättrade funktioner

  • Mark Zuckerberg har meddelat att Llama 4 kommer att ha "agentfunktioner" som möjliggör nya användningsområden
  • Meta syftar till att utveckla AI-modeller som kan "utföra generaliserade handlingar, kommunicera naturligt med människor och lösa utmanande problem"
  • Företaget överväger att erbjuda premiumprenumerationer för sin AI-assistent för agentrelaterade ändamål som bokningar eller videoproduktion

Varför Llama 4 är en vändpunkt i AI-landskapet

Lanseringen av Llama 4 representerar ett viktigt steg i Metas strategi att bli ledande inom det mycket konkurrensutsatta området generativ AI. Med introduktionen av Mixture of Experts-arkitekturen, nativ multimodalitet och ett imponerande långt kontextfönster visar Meta att öppna modeller kan konkurrera med de proprietära modellerna från stora teknikföretag.

Trots kontroverserna kring licensiering och frågan om huruvida Llama 4 verkligen borde kallas "öppen källkod", representerar de tekniska framstegen en betydande milstolpe. Modellernas förmåga att bearbeta både text och bilder öppnar upp nya möjligheter för utvecklare och företag.

Med Llama 4 Behemoth fortfarande under utveckling och de aviserade planerna för förbättrade språk- och agentfunktioner är det tydligt att Meta kommer att intensifiera sina investeringar i AI ytterligare. De kommande månaderna kommer att visa hur dessa nya modeller kommer att förändra AI-landskapet och om de verkligen, som Mark Zuckerberg förutspådde, kommer att hjälpa öppna AI-modeller att bli den ledande kraften inom artificiell intelligens.

Lämplig för detta:

 

Din globala marknadsförings- och affärsutvecklingspartner

☑ Vårt affärsspråk är engelska eller tyska

☑ Nytt: korrespondens på ditt nationella språk!

 

Konrad Wolfenstein

Jag är glad att vara tillgänglig för dig och mitt team som personlig konsult.

Du kan kontakta mig genom att fylla i kontaktformuläret eller helt enkelt ringa mig på +49 89 674 804 (München) . Min e -postadress är: Wolfenstein xpert.digital

Jag ser fram emot vårt gemensamma projekt.

 

 

☑ SME -stöd i strategi, rådgivning, planering och implementering

☑ skapande eller omjustering av den digitala strategin och digitaliseringen

☑ Expansion och optimering av de internationella försäljningsprocesserna

☑ Globala och digitala B2B -handelsplattformar

☑ Pioneer Business Development / Marketing / PR / Measure

Lämna den mobila versionen