Gepubliceerd op: 6 april 2025 / UPDATE VAN: 6 april 2025 - Auteur: Konrad Wolfenstein
LLAMA 4: De nieuwe generatie Open AI -systemen van Meta
LLAMA 4 onthulde: MetaS -sleutel tot de volgende AI -leeftijd
Meta presenteerde de nieuwste generatie van zijn AI -modellen, LLAMA 4, op 5 april 2025. Deze nieuwe modellen vertegenwoordigen aanzienlijke vooruitgang in de ontwikkeling van open AI -systemen en hebben een aantal baanbrekende functies die hun prestaties en efficiëntie aanzienlijk vergroten. De LLAMA 4 -serie bestaat uit verschillende modellen, met twee van hen al openbaar beschikbaar, terwijl het krachtigste model nog steeds in de trainingsfase staat.
Geschikt hiervoor:
De LLAMA 4 -modelfamilie
Meta heeft drie verschillende modellen ontwikkeld in de Lama 4 -serie, die elk zijn geoptimaliseerd voor verschillende toepassingen:
LLAMA 4 Scout
LLAMA 4 Scout is een compact model met indrukwekkende technische specificaties:
- 17 miljard actieve parameters met 16 experts (in totaal 109 miljard parameters)
- Kan worden bediend op een enkele NVIDIA H100 GPU met INT4 -kwantisatie
- Heeft een opmerkelijk groot contextvenster van 10 miljoen tokens, waardoor het een van de eerste open modellen is met deze capaciteit
Volgens Meta overschrijdt Scout andere modellen in zijn klasse zoals Gemini 3, Gemini 2.0 flash-lite en mistral 3.1. Het is met name geschikt voor taken zoals de samenvatting van lange documenten, personalisatie op basis van gebruikersgegevens en complexe conclusies over grote hoeveelheden kennis.
LLAMA 4 MAVERICK
LLAMA 4 Maverick is de krachtiger van de twee beschikbare modellen:
- 17 miljard actieve parameters met 128 experts (in totaal 400 miljard parameters)
- De experimentele chatversie bereikte ELO 1417 op Lmarena
- Overschrijdt modellen zoals GPT-4O en Gemini 2.0 Flash in talloze benchmarks
Dit model is met name geschikt voor algemene hulp- en chat -applicaties zoals creatief schrijven en toont resultaten die vergelijkbaar zijn met Deepseek V3 in redeneren en coderingstaken, maar met de helft van de parameters.
Lama 4 kolos
Lama 4 Behemoth is het krachtigste model van Metas, dat nog niet publiekelijk beschikbaar is:
- 288 miljard actieve parameters met 16 experts (in totaal bijna 2 biljoen parameters)
- Volgens Meta overschrijdt het GPT-4.5, Claude Sonnet 3.7 en Gemini 2.0 Pro voor verschillende STEM-benchmarks
- Dient als een "lerarenmodel" voor de kleinere Lama 4 -modellen
Behemoth bevindt zich momenteel nog in de trainingsfase en zal op een later tijdstip worden gepubliceerd.
Technische innovaties
De LLAMA 4 -modelserie introduceert verschillende belangrijke technische innovaties die hun prestaties en efficiëntie verbeteren:
Mix van experts (MOE) architectuur
Een van de belangrijkste innovaties bij LLAMA 4 is de combinatie van experts (MOE) -architectuur, waarin slechts een deel van de modelparameters voor elke token wordt geactiveerd:
- Dit vermindert de berekeningsinspanning en latentie aanzienlijk, terwijl de hoge prestaties behouden blijven
- Bij LLAMA 4 Maverick wordt elk token verwerkt door een gemeenschappelijke expert en een van de 128 geriseerde experts
- Deze architectuur maakt het mogelijk om de totale parameter van het model te vergroten zonder de inferentiekosten te verhogen
Inheemse multimodaliteit met vroege fusie
LLAMA 4 is het eerste open model met native multimodaliteit door vroege fusie:
- Tekst- en beeldtokens zijn geïntegreerd in een uniforme modelarchitectuur
- Dit maakt gezamenlijke voorlopige training mogelijk met grote hoeveelheden tekst-, afbeeldings- en videogegevens
- In tegenstelling tot LLAMA 3.2, die afzonderlijke parameters voor tekst en afbeeldingen gebruikte, begrijpt LLAMA 4 beide modaliteiten die native zijn met dezelfde parameters
Extreem lang contextvenster
Het extreem lange contextvenster van Lama 4 Scout is bijzonder indrukwekkend:
- Met 10 miljoen tokens overschrijdt het duidelijk de meeste beschikbare modellen
- Dit maakt de verwerking van zeer lange documenten, volledige codebases of uitgebreide gesprekken mogelijk
- De Irope -architectuur (interleaved aandachtlagen) maakt dit mogelijk
Nieuwe trainingsmethoden
Meta heeft verschillende innovatieve methoden gebruikt voor de training van LLAMA 4:
- METAP: een techniek voor de robuuste coördinatie van kritieke modelhyperameter
- FP8 Precisie: gebruik van 8-bits dia-gemaakte nummers voor efficiënte training
- Co-distillatie: gebruik van lama 4 kolos als een lerarenmodel voor kleinere modellen
- Volledig asynchrone online leren met versterkingen: een nieuwe infrastructuur voor grootschalig leren
Beschikbaarheid en integratie
De LLAMA 4 -modellen zijn beschikbaar via verschillende platforms en services:
Download en cloudprovider
- De modellen Scout en Maverick kunnen rechtstreeks worden gedownload van meta of via knuffelgezicht
- Ze zijn ook beschikbaar via verschillende cloudplatforms:
- Cloudflare werknemers ai
- Azure AI Foundry en Azure Databricks
- Google Cloud's Vertex AI
- Andere partners zullen de komende dagen volgen
Integratie in meta -producten
Meta heeft zijn AI -assistenten al bijgewerkt in verschillende platforms op LLAMA 4:
- WhatsApp, Messenger en Instagram direct in 40 verschillende landen
- De website meta.ai
- De multimodale functies zijn momenteel echter alleen beschikbaar voor Engelse -taalgebruikers in de VS.
Geschikt hiervoor:
- Meta AI in Duitsland is hier! WhatsApp, Instagram & Facebook krijgen AI-met belangrijke verschillen in de Amerikaanse versie
Licentie en controverse
Hoewel Meta Lama 4 verwijst naar de "open source", zijn er enkele beperkingen in de licentie die de controverse veroorzaakten:
Licentiebeperkingen
De LLAMA 4 community licentie bevat verschillende beperkingen:
- Bedrijven met meer dan 700 miljoen maandelijkse actieve gebruikers hebben een speciale licentie van Meta nodig
- De modellen mogen blijkbaar geen gebruikers en bedrijven uit de EU gebruiken of distribueren, vermoedelijk vanwege wettelijke vereisten
- Er zijn vereisten met betrekking tot naamgeving en toeschrijving voor afgeleide modellen
Debat over "open source"
Er is een debat over de vraag of LLAMA 4 eigenlijk "open source" moet worden genoemd:
- Het Open Source -initiatief vond in 2023 dat de beperkingen in de LLA -licentie het uit de categorie 'Open Source' halen
- Critici beweren dat het meer een "bron-open" of "met open gewichten" is dan echte open source-software
- De licentiebeperkingen kunnen problematisch zijn voor kleine bedrijven zonder hun eigen juridische afdelingen
Toekomstplannen
Meta heeft al enkele inzichten gegeven in zijn toekomstplannen voor Lama 4 en daarna:
Llamacon en andere aankondigingen
- Meta organiseert de eerste Llamacon -conferentie op 29 april 2025, waarin verdere details over de AI -modellen en productplannen worden aangekondigd
- Het bedrijf is ook van plan om in het tweede kwartaal een speciale aanvraag voor zijn meta-chat-bot te publiceren
Uitbreiding van taalvaardigheden
- Meta werkt aan het verbeteren van de taalvaardigheden van Lama 4 om meer natuurlijke gesprekken mogelijk te maken
- Het doel is om meer vloeiende, tweezijdige dialogen mogelijk te maken waarin gebruikers het AI-model kunnen onderbreken
- Chris Cox, Chief Product Officer van Meta, beschreef de komende LLAMA 4 als een "omni -model" dat moedertaal mogelijk maakt in plaats van taal in tekst te vertalen
Agentische AI en uitgebreide vaardigheden
- Mark Zuckerberg heeft aangekondigd dat LLAMA 4 "agentvaardigheden" zal hebben die nieuwe applicaties mogelijk maken
- Meta wil AI -modellen ontwikkelen die "gegeneraliseerde acties uitvoeren, natuurlijk communiceren met mensen en uitdagende problemen oplossen"
- Het bedrijf overweegt premium -abonnementen aan te bieden voor zijn AI -assistent voor agentdoeleinden zoals reserveringen of videoproductie
Waarom Lama 4 een keerpunt is in het AI -landschap
De publicatie van LLAMA 4 is een belangrijke stap in de metasstrategie om het leidende gebied van de generatieve AI in het zeer competitieve gebied te worden. Met de introductie van de mix van experts -architectuur, native multimodaliteit en een indrukwekkend lang contextvenster toont Meta aan dat open modellen de eigen modellen van de grote technologiebedrijven kunnen bijhouden.
Ondanks de controverse over de licenties en de vraag of LLAMA 4 echt een "open source" moet worden genoemd, is technische vooruitgang een belangrijke mijlpaal. Het vermogen van de modellen om zowel tekst als afbeeldingen te verwerken, biedt nieuwe kansen voor ontwikkelaars en bedrijven.
Met de uitstekende LLAMA 4 Behemoth en de aangekondigde plannen voor uitgebreide taal- en agentvaardigheden, is het duidelijk dat Meta zijn investeringen in AI verder zal intensiveren. De komende maanden zullen laten zien hoe deze nieuwe modellen het AI -landschap veranderen en of, zoals voorspeld door Mark Zuckerberg, ze daadwerkelijk zullen helpen om open AI -modellen te maken op het gebied van kunstmatige intelligentie.
Geschikt hiervoor:
Uw wereldwijde partner voor marketing en bedrijfsontwikkeling
☑️ onze zakelijke taal is Engels of Duits
☑️ Nieuw: correspondentie in uw nationale taal!
Ik ben blij dat ik beschikbaar ben voor jou en mijn team als een persoonlijk consultant.
U kunt contact met mij opnemen door het contactformulier hier in te vullen of u gewoon te bellen op +49 89 674 804 (München) . Mijn e -mailadres is: Wolfenstein ∂ Xpert.Digital
Ik kijk uit naar ons gezamenlijke project.