
Meta introduceert nieuwe AI-modelserie Llama 4 Scout, Maverick en Behemoth – Afbeelding: Xpert.Digital
Llama 4: De nieuwe generatie open AI-systemen van Meta
Llama 4 onthuld: Meta's sleutel tot het volgende tijdperk van AI
Op 5 april 2025 onthulde Meta de nieuwste generatie van zijn AI-modellen, Llama 4. Deze nieuwe modellen vertegenwoordigen een aanzienlijke vooruitgang in de ontwikkeling van open AI-systemen en beschikken over een aantal baanbrekende mogelijkheden die hun prestaties en efficiëntie aanzienlijk verbeteren. De Llama 4-serie omvat verschillende modellen, waarvan er twee al publiekelijk beschikbaar zijn, terwijl het krachtigste model zich nog in de trainingsfase bevindt.
Geschikt hiervoor:
De Llama 4 modelfamilie
Meta heeft drie verschillende modellen ontwikkeld in de Llama 4-serie, elk geoptimaliseerd voor verschillende toepassingen:
Lama 4 Scout
Llama 4 Scout is een compact model met indrukwekkende technische specificaties:
- 17 miljard actieve parameters met 16 experts (in totaal 109 miljard parameters)
- Kan worden uitgevoerd op een enkele NVIDIA H100 GPU met Int4-kwantisering.
- Het beschikt over een opmerkelijk groot contextvenster van 10 miljoen tokens, waardoor het een van de eerste open modellen met deze capaciteit is.
Volgens Meta presteert Scout beter dan andere modellen in zijn klasse, zoals de Gemini 3, Gemini 2.0 Flash-Lite en Mistral 3.1. Het is met name geschikt voor taken zoals het samenvatten van lange documenten, het personaliseren van content op basis van gebruikersgegevens en het trekken van complexe conclusies uit grote hoeveelheden informatie.
Lama 4 Maverick
De Llama 4 Maverick is het krachtigere van de twee beschikbare modellen:
- 17 miljard actieve parameters met 128 experts (400 miljard parameters in totaal)
- De experimentele chatversie bereikte ELO 1417 op LMArena.
- Volgens Meta presteert het in tal van benchmarks beter dan modellen zoals de GPT-4o en de Gemini 2.0 Flash.
Dit model is bijzonder geschikt voor algemene assistentie- en chattoepassingen zoals creatief schrijven en levert resultaten die vergelijkbaar zijn met DeepSeek v3 bij redeneer- en codeertaken, maar met de helft van het aantal parameters.
Lama 4 Behemoth
Llama 4 Behemoth is Meta's krachtigste model, maar is nog niet publiekelijk beschikbaar:
- 288 miljard actieve parameters met 16 experts (in totaal bijna 2 biljoen parameters)
- Volgens Meta presteert het in verschillende STEM-benchmarks beter dan GPT-4.5, Claude Sonnet 3.7 en Gemini 2.0 Pro.
- Dient als een "leermodel" voor de kleinere Llama 4-modellen.
Behemoth bevindt zich momenteel nog in de trainingsfase en zal op een later tijdstip worden uitgebracht.
Technische innovaties
De Llama 4-modellenreeks introduceert diverse belangrijke technische innovaties die de prestaties en efficiëntie verbeteren:
Mengsel van deskundigen (MoE) Architectuur
Een van de belangrijkste innovaties in Llama 4 is de Mixture of Experts (MoE)-architectuur, waarbij voor elk token slechts een subset van de modelparameters wordt geactiveerd:
- Dit vermindert de rekeninspanning en latentie aanzienlijk, terwijl de hoge prestaties behouden blijven.
- In Llama 4 Maverick wordt elk token verwerkt door een gedeelde expert en een van de 128 gerouteerde experts.
- Deze architectuur maakt het mogelijk om het totale aantal parameters van het model te verhogen zonder de inferentiekosten te verhogen.
Native multimodaliteit met vroege fusie
Llama 4 is het eerste open model met native multimodaliteit dankzij Early Fusion:
- Tekst- en beeldtokens zijn geïntegreerd in een uniforme modelarchitectuur.
- Dit maakt gezamenlijke pre-training met grote hoeveelheden tekst-, beeld- en videogegevens mogelijk.
- In tegenstelling tot Llama 3.2, dat aparte parameters gebruikte voor tekst en afbeeldingen, begrijpt Llama 4 beide modaliteiten van nature met dezelfde parameters.
Extreem lang contextvenster
Het extreem lange contextvenster van Llama 4 Scout is bijzonder indrukwekkend:
- Met 10 miljoen tokens overtreft het de meeste beschikbare modellen aanzienlijk.
- Dit maakt de verwerking van zeer lange documenten, complete codebases of uitgebreide gesprekken mogelijk.
- De iRoPE-architectuur (interleaved attention layers) maakt dit mogelijk.
Nieuwe trainingsmethoden
Meta heeft verschillende innovatieve methoden gebruikt voor de training van Lama 4:
- MetaP: een techniek voor het robuust afstemmen van kritieke modelhyperparameters
- FP8-precisie: Het gebruik van 8-bits drijvende-komma getallen voor efficiënte training
- Co-destillatie: Llama 4 Behemoth gebruiken als model voor kleinere modellen
- Volledig asynchroon online leren met versterking: een nieuwe infrastructuur voor grootschalig leren.
Beschikbaarheid en integratie
De Llama 4-modellen zijn verkrijgbaar via verschillende platforms en diensten:
Download- en cloudproviders
- De Scout- en Maverick-modellen kunnen rechtstreeks van Meta of via Hugging Face worden gedownload.
- Ze zijn ook beschikbaar via verschillende cloudplatformen:
- Cloudflare Workers AI
- Azure AI Foundry en Azure Databricks
- Vertex AI van Google Cloud
- De komende dagen zullen meer partners volgen.
Integratie in metaproducten
Meta heeft zijn AI-assistenten op verschillende platformen al geüpdatet naar Llama 4:
- WhatsApp, Messenger en Instagram Direct in 40 verschillende landen.
- De Meta.AI-website
- De multimodale functies zijn momenteel echter alleen beschikbaar voor Engelstalige gebruikers in de VS.
Geschikt hiervoor:
- Meta AI is nu ook in Duitsland beschikbaar! WhatsApp, Instagram en Facebook krijgen AI – met belangrijke verschillen ten opzichte van de Amerikaanse versie
Licenties en controverses
Hoewel Meta Llama 4 wordt omschreven als "open source", bevat de licentie enkele beperkingen die tot controverse hebben geleid:
Licentiebeperkingen
De Llama 4 Community-licentie bevat diverse beperkingen:
- Bedrijven met meer dan 700 miljoen maandelijks actieve gebruikers hebben een speciale licentie van Meta nodig.
- Gebruikers en bedrijven uit de EU mogen de modellen kennelijk niet gebruiken of verspreiden, vermoedelijk vanwege wettelijke voorschriften.
- Er gelden eisen met betrekking tot de naamgeving en toeschrijving van afgeleide modellen.
Debat over "open source"
Er bestaat discussie over de vraag of Llama 4 wel echt "open source" genoemd mag worden:
- Het Open Source Initiative heeft in 2023 vastgesteld dat de beperkingen in de Llama-licentie ervoor zorgen dat het "niet langer in de categorie 'open source' valt".
- Critici beweren dat het meer een "source-open" of "weights-open" model is dan echte open-source software.
- De beperkingen op de vergunningverlening kunnen problematisch zijn voor kleine bedrijven zonder eigen juridische afdeling.
Toekomstplannen
Meta heeft al een tipje van de sluier opgelicht over zijn toekomstplannen voor Llama 4 en verder:
LlamaCon en andere aankondigingen
- Meta organiseert op 29 april 2025 haar eerste LlamaCon-conferentie, waar meer details over haar AI-modellen en productplannen bekendgemaakt zullen worden.
- Het bedrijf is ook van plan om in het tweede kwartaal een speciale applicatie voor zijn meta-chatbot uit te brengen.
Taalvaardigheden uitbreiden
- Meta werkt eraan om de taalvaardigheid van Llama 4 te verbeteren, zodat er natuurlijker gesprekken gevoerd kunnen worden.
- Het doel is om soepelere, tweewegsdialogen mogelijk te maken, waarbij gebruikers het AI-model kunnen onderbreken.
- Chris Cox, Chief Product Officer van Meta, omschreef de aankomende Llama 4 als een "omni-model" dat gebruikmaakt van de moedertaal in plaats van spraak naar tekst te vertalen.
Agentische AI en verbeterde mogelijkheden
- Mark Zuckerberg heeft aangekondigd dat Llama 4 "agentische mogelijkheden" zal hebben die nieuwe toepassingsmogelijkheden zullen creëren.
- Meta streeft ernaar AI-modellen te ontwikkelen die "algemene handelingen kunnen uitvoeren, op een natuurlijke manier met mensen kunnen communiceren en complexe problemen kunnen oplossen."
- Het bedrijf overweegt premium-abonnementen aan te bieden voor zijn AI-assistent voor taken die met agenten te maken hebben, zoals reserveringen of videoproductie.
Waarom Llama 4 een keerpunt is in het AI-landschap
De release van Llama 4 is een belangrijke stap in Meta's strategie om een leider te worden in het zeer competitieve veld van generatieve AI. Met de introductie van de Mixture of Experts-architectuur, native multimodaliteit en een indrukwekkend lang contextvenster, laat Meta zien dat open modellen kunnen concurreren met de propriëtaire modellen van grote technologiebedrijven.
Ondanks de controverses rondom licenties en de vraag of Llama 4 wel echt 'open source' genoemd mag worden, vormen de technische verbeteringen een belangrijke mijlpaal. Het vermogen van de modellen om zowel tekst als afbeeldingen te verwerken, opent nieuwe mogelijkheden voor ontwikkelaars en bedrijven.
Met de nog steeds in afwachting zijnde Llama 4 Behemoth en de aangekondigde plannen voor verbeterde taal- en agentmogelijkheden, is het duidelijk dat Meta zijn investeringen in AI verder zal intensiveren. De komende maanden zullen uitwijzen hoe deze nieuwe modellen het AI-landschap zullen veranderen en of ze, zoals Mark Zuckerberg voorspelde, er inderdaad voor zullen zorgen dat open AI-modellen de leidende kracht in kunstmatige intelligentie worden.
Geschikt hiervoor:
Uw wereldwijde partner voor marketing en bedrijfsontwikkeling
☑️ onze zakelijke taal is Engels of Duits
☑️ Nieuw: correspondentie in uw nationale taal!
Ik ben blij dat ik beschikbaar ben voor jou en mijn team als een persoonlijk consultant.
U kunt contact met mij opnemen door het contactformulier hier in te vullen of u gewoon te bellen op +49 89 674 804 (München) . Mijn e -mailadres is: Wolfenstein ∂ Xpert.Digital
Ik kijk uit naar ons gezamenlijke project.

