Meta brengt een nieuwe serie AI-modellen uit: Llama 4 Scout, Maverick en Behemoth

Konrad Wolfenstein

1 jaar geleden

Meta introduceert nieuwe AI-modelserie Llama 4 Scout, Maverick en Behemoth – Afbeelding: Xpert.Digital

Llama 4: De nieuwe generatie open AI-systemen van Meta

Llama 4 onthuld: Meta's sleutel tot het volgende tijdperk van AI

Op 5 april 2025 onthulde Meta de nieuwste generatie van zijn AI-modellen, Llama 4. Deze nieuwe modellen vertegenwoordigen een aanzienlijke vooruitgang in de ontwikkeling van open AI-systemen en beschikken over een aantal baanbrekende mogelijkheden die hun prestaties en efficiëntie aanzienlijk verbeteren. De Llama 4-serie omvat verschillende modellen, waarvan er twee al publiekelijk beschikbaar zijn, terwijl het krachtigste model zich nog in de trainingsfase bevindt.

Dit is hiermee gerelateerd:

AI-modellen eenvoudig uitgelegd: Begrijp de basisprincipes van AI, taalmodellen en redenering

De Llama 4 modelfamilie

Meta heeft drie verschillende modellen ontwikkeld in de Llama 4-serie, elk geoptimaliseerd voor verschillende toepassingen:

Lama 4 Scout

Llama 4 Scout is een compact model met indrukwekkende technische specificaties:

17 miljard actieve parameters met 16 experts (in totaal 109 miljard parameters)
Kan worden uitgevoerd op een enkele NVIDIA H100 GPU met Int4-kwantisering
Het beschikt over een opmerkelijk groot contextvenster van 10 miljoen tokens, waardoor het een van de eerste open modellen met deze capaciteit is

Volgens Meta presteert Scout beter dan andere modellen in zijn klasse, zoals de Gemini 3, Gemini 2.0 Flash-Lite en Mistral 3.1. Het is met name geschikt voor taken zoals het samenvatten van lange documenten, het personaliseren van content op basis van gebruikersgegevens en het trekken van complexe conclusies uit grote hoeveelheden informatie.

Lama 4 Maverick

De Llama 4 Maverick is het krachtigere van de twee beschikbare modellen:

17 miljard actieve parameters met 128 experts (400 miljard parameters in totaal)
De experimentele chatversie bereikte ELO 1417 op LMArena
Volgens Meta presteert het in tal van benchmarks beter dan modellen zoals de GPT-4o en de Gemini 2.0 Flash

Dit model is bijzonder geschikt voor algemene assistentie- en chattoepassingen zoals creatief schrijven en levert resultaten die vergelijkbaar zijn met DeepSeek v3 bij redeneer- en codeertaken, maar met de helft van het aantal parameters.

Lama 4 Behemoth

Llama 4 Behemoth is Meta's krachtigste model, maar is nog niet publiekelijk beschikbaar:

288 miljard actieve parameters met 16 experts (in totaal bijna 2 biljoen parameters)
Volgens Meta presteert het in verschillende STEM-benchmarks beter dan GPT-4.5, Claude Sonnet 3.7 en Gemini 2.0 Pro
Dient als "leermodel" voor de kleinere Llama 4-modellen

Behemoth bevindt zich momenteel nog in de trainingsfase en zal op een later tijdstip worden uitgebracht.

Technische innovaties

De Llama 4-modellenreeks introduceert diverse belangrijke technische innovaties die de prestaties en efficiëntie verbeteren:

Mengsel van deskundigen (MoE) Architectuur

Een van de belangrijkste innovaties in Llama 4 is de Mixture of Experts (MoE)-architectuur, waarbij voor elk token slechts een subset van de modelparameters wordt geactiveerd:

Dit vermindert de rekeninspanning en latentie aanzienlijk, terwijl de hoge prestaties behouden blijven
In Llama 4 Maverick wordt elk token verwerkt door een gedeelde expert en een van de 128 gerouteerde experts
Deze architectuur maakt het mogelijk om het totale aantal parameters van het model te verhogen zonder de inferentiekosten te verhogen

Native multimodaliteit met vroege fusie

Llama 4 is het eerste open model met native multimodaliteit dankzij Early Fusion:

Tekst- en beeldtokens zijn geïntegreerd in een uniforme modelarchitectuur
Dit maakt gezamenlijke pre-training met grote hoeveelheden tekst-, beeld- en videogegevens mogelijk
In tegenstelling tot Llama 3.2, dat aparte parameters gebruikte voor tekst en afbeeldingen, begrijpt Llama 4 beide modaliteiten van nature met dezelfde parameters

Extreem lang contextvenster

Het extreem lange contextvenster van Llama 4 Scout is bijzonder indrukwekkend:

Met 10 miljoen tokens overtreft het de meeste beschikbare modellen aanzienlijk
Dit maakt de verwerking van zeer lange documenten, complete codebases of uitgebreide gesprekken mogelijk
De iRoPE-architectuur (interleaved attention layers) maakt dit mogelijk

Nieuwe trainingsmethoden

Meta heeft verschillende innovatieve methoden gebruikt voor de training van Lama 4:

MetaP: een techniek voor het robuust afstemmen van kritieke modelhyperparameters
FP8-precisie: Het gebruik van 8-bits drijvende-komma getallen voor efficiënte training
Co-destillatie: Llama 4 Behemoth gebruiken als model voor kleinere modellen
Volledig asynchroon online leren met versterking: een nieuwe infrastructuur voor grootschalig leren

Beschikbaarheid en integratie

De Llama 4-modellen zijn verkrijgbaar via verschillende platforms en diensten:

Download- en cloudproviders

De Scout- en Maverick-modellen kunnen rechtstreeks van Meta of via Hugging Face worden gedownload
Ze zijn ook beschikbaar via verschillende cloudplatformen:
- Cloudflare Workers AI
- Azure AI Foundry en Azure Databricks
- Vertex AI van Google Cloud
- De komende dagen zullen meer partners volgen

Integratie in metaproducten

Meta heeft zijn AI-assistenten op verschillende platformen al geüpdatet naar Llama 4:

WhatsApp, Messenger en Instagram Direct in 40 verschillende landen
De Meta.AI-website
De multimodale functies zijn momenteel echter alleen beschikbaar voor Engelstalige gebruikers in de VS

Dit is hiermee gerelateerd:

Meta AI is nu ook in Duitsland beschikbaar! WhatsApp, Instagram en Facebook krijgen AI – met belangrijke verschillen ten opzichte van de Amerikaanse versie

Licenties en controverses

Hoewel Meta Llama 4 wordt omschreven als "open source", bevat de licentie enkele beperkingen die tot controverse hebben geleid:

Licentiebeperkingen

De Llama 4 Community-licentie bevat diverse beperkingen:

Bedrijven met meer dan 700 miljoen maandelijks actieve gebruikers hebben een speciale licentie van Meta nodig
Gebruikers en bedrijven uit de EU mogen de modellen kennelijk niet gebruiken of verspreiden, vermoedelijk vanwege wettelijke voorschriften
Er gelden eisen met betrekking tot de naamgeving en toeschrijving van afgeleide modellen

Debat over "open source"

Er bestaat discussie over de vraag of Llama 4 wel echt "open source" genoemd mag worden:

Het Open Source Initiative heeft in 2023 vastgesteld dat de beperkingen in de Llama-licentie ervoor zorgen dat het "niet langer in de categorie 'open source' valt"
Critici beweren dat het meer een "source-open" of "weights-open" model is dan echte open-source software
De beperkingen op de vergunningverlening kunnen problematisch zijn voor kleine bedrijven zonder eigen juridische afdeling

Toekomstplannen

Meta heeft al een tipje van de sluier opgelicht over zijn toekomstplannen voor Llama 4 en verder:

LlamaCon en andere aankondigingen

Meta organiseert op 29 april 2025 haar eerste LlamaCon-conferentie, waar meer details over haar AI-modellen en productplannen bekendgemaakt zullen worden
Het bedrijf is ook van plan om in het tweede kwartaal een speciale applicatie voor zijn meta-chatbot uit te brengen

Taalvaardigheden uitbreiden

Meta werkt eraan om de taalvaardigheid van Llama 4 te verbeteren, zodat er natuurlijker gesprekken gevoerd kunnen worden
Het doel is om soepelere, tweewegsdialogen mogelijk te maken, waarbij gebruikers het AI-model kunnen onderbreken
Chris Cox, Chief Product Officer van Meta, omschreef de aankomende Llama 4 als een "omni-model" dat gebruikmaakt van de moedertaal in plaats van spraak naar tekst te vertalen

Agentische AI en verbeterde mogelijkheden

Mark Zuckerberg heeft aangekondigd dat Llama 4 "agentische mogelijkheden" zal hebben die nieuwe toepassingsmogelijkheden zullen creëren
Meta streeft ernaar AI-modellen te ontwikkelen die "algemene handelingen kunnen uitvoeren, op een natuurlijke manier met mensen kunnen communiceren en complexe problemen kunnen oplossen."
Het bedrijf overweegt premium-abonnementen aan te bieden voor zijn AI-assistent voor taken die met agenten te maken hebben, zoals reserveringen of videoproductie

Waarom Llama 4 een keerpunt is in het AI-landschap

De release van Llama 4 is een belangrijke stap in Meta's strategie om een leider te worden in het zeer competitieve veld van generatieve AI. Met de introductie van de Mixture of Experts-architectuur, native multimodaliteit en een indrukwekkend lang contextvenster, laat Meta zien dat open modellen kunnen concurreren met de propriëtaire modellen van grote technologiebedrijven.

Ondanks de controverses rondom licenties en de vraag of Llama 4 wel echt "open source" genoemd mag worden, vormen de technische verbeteringen een belangrijke mijlpaal. Het vermogen van de modellen om zowel tekst als afbeeldingen te verwerken, opent nieuwe mogelijkheden voor ontwikkelaars en bedrijven.

Met de nog steeds in afwachting zijnde Llama 4 Behemoth en de aangekondigde plannen voor verbeterde taal- en agentmogelijkheden, is het duidelijk dat Meta zijn investeringen in AI verder zal intensiveren. De komende maanden zullen uitwijzen hoe deze nieuwe modellen het AI-landschap zullen veranderen en of ze, zoals Mark Zuckerberg voorspelde, er inderdaad voor zullen zorgen dat open AI-modellen de leidende kracht in kunstmatige intelligentie worden.

Dit is hiermee gerelateerd:

Uw wereldwijde partner voor marketing en bedrijfsontwikkeling

☑️ Onze zakelijke voertaal is Engels of Duits

☑️ NIEUW: Correspondentie in uw moedertaal!

Konrad Wolfenstein

Mijn team en ik staan graag tot uw beschikking als uw persoonlijke adviseur.

U kunt contact met mij opnemen door hier het contactformulier in te vullen wolfenstein@xpert.digital:of door mij te bellen op +49 7348 4088 965. Mijn e-mailadres is

Ik kijk uit naar ons gezamenlijke project.

Meta brengt een nieuwe serie AI-modellen uit: Llama 4 Scout, Maverick en Behemoth

Llama 4: De nieuwe generatie open AI-systemen van Meta