⭐️ Artificial Intelligence (AI) -AI Blog, Hotspot en Content Hub ⭐️ Digitale intelligentie ⭐️ XPaper

Spraakselectie 📢

Meta publiceert New Lama 4 Scout, Maverick en Behemoth

Gepubliceerd op: 6 april 2025 / UPDATE VAN: 6 april 2025 - Auteur: Konrad Wolfenstein

Meta publiceert New Lama 4 Scout, Maverick en Behemoth-Image: Xpert.Digital

LLAMA 4: De nieuwe generatie Open AI -systemen van Meta

LLAMA 4 onthulde: MetaS -sleutel tot de volgende AI -leeftijd

Meta presenteerde de nieuwste generatie van zijn AI -modellen, LLAMA 4, op 5 april 2025. Deze nieuwe modellen vertegenwoordigen aanzienlijke vooruitgang in de ontwikkeling van open AI -systemen en hebben een aantal baanbrekende functies die hun prestaties en efficiëntie aanzienlijk vergroten. De LLAMA 4 -serie bestaat uit verschillende modellen, met twee van hen al openbaar beschikbaar, terwijl het krachtigste model nog steeds in de trainingsfase staat.

Geschikt hiervoor:

Simpelweg uitgelegd AI -modellen: begrijp de basisprincipes van AI, spraakmodellen en redeneren

De LLAMA 4 -modelfamilie

Meta heeft drie verschillende modellen ontwikkeld in de Lama 4 -serie, die elk zijn geoptimaliseerd voor verschillende toepassingen:

LLAMA 4 Scout

LLAMA 4 Scout is een compact model met indrukwekkende technische specificaties:

17 miljard actieve parameters met 16 experts (in totaal 109 miljard parameters)
Kan worden bediend op een enkele NVIDIA H100 GPU met INT4 -kwantisatie
Heeft een opmerkelijk groot contextvenster van 10 miljoen tokens, waardoor het een van de eerste open modellen is met deze capaciteit

Volgens Meta overschrijdt Scout andere modellen in zijn klasse zoals Gemini 3, Gemini 2.0 flash-lite en mistral 3.1. Het is met name geschikt voor taken zoals de samenvatting van lange documenten, personalisatie op basis van gebruikersgegevens en complexe conclusies over grote hoeveelheden kennis.

LLAMA 4 MAVERICK

LLAMA 4 Maverick is de krachtiger van de twee beschikbare modellen:

17 miljard actieve parameters met 128 experts (in totaal 400 miljard parameters)
De experimentele chatversie bereikte ELO 1417 op Lmarena
Overschrijdt modellen zoals GPT-4O en Gemini 2.0 Flash in talloze benchmarks

Dit model is met name geschikt voor algemene hulp- en chat -applicaties zoals creatief schrijven en toont resultaten die vergelijkbaar zijn met Deepseek V3 in redeneren en coderingstaken, maar met de helft van de parameters.

Lama 4 kolos

Lama 4 Behemoth is het krachtigste model van Metas, dat nog niet publiekelijk beschikbaar is:

288 miljard actieve parameters met 16 experts (in totaal bijna 2 biljoen parameters)
Volgens Meta overschrijdt het GPT-4.5, Claude Sonnet 3.7 en Gemini 2.0 Pro voor verschillende STEM-benchmarks
Dient als een "lerarenmodel" voor de kleinere Lama 4 -modellen

Behemoth bevindt zich momenteel nog in de trainingsfase en zal op een later tijdstip worden gepubliceerd.

Technische innovaties

De LLAMA 4 -modelserie introduceert verschillende belangrijke technische innovaties die hun prestaties en efficiëntie verbeteren:

Mix van experts (MOE) architectuur

Een van de belangrijkste innovaties bij LLAMA 4 is de combinatie van experts (MOE) -architectuur, waarin slechts een deel van de modelparameters voor elke token wordt geactiveerd:

Dit vermindert de berekeningsinspanning en latentie aanzienlijk, terwijl de hoge prestaties behouden blijven
Bij LLAMA 4 Maverick wordt elk token verwerkt door een gemeenschappelijke expert en een van de 128 geriseerde experts
Deze architectuur maakt het mogelijk om de totale parameter van het model te vergroten zonder de inferentiekosten te verhogen

Inheemse multimodaliteit met vroege fusie

LLAMA 4 is het eerste open model met native multimodaliteit door vroege fusie:

Tekst- en beeldtokens zijn geïntegreerd in een uniforme modelarchitectuur
Dit maakt gezamenlijke voorlopige training mogelijk met grote hoeveelheden tekst-, afbeeldings- en videogegevens
In tegenstelling tot LLAMA 3.2, die afzonderlijke parameters voor tekst en afbeeldingen gebruikte, begrijpt LLAMA 4 beide modaliteiten die native zijn met dezelfde parameters

Extreem lang contextvenster

Het extreem lange contextvenster van Lama 4 Scout is bijzonder indrukwekkend:

Met 10 miljoen tokens overschrijdt het duidelijk de meeste beschikbare modellen
Dit maakt de verwerking van zeer lange documenten, volledige codebases of uitgebreide gesprekken mogelijk
De Irope -architectuur (interleaved aandachtlagen) maakt dit mogelijk

Nieuwe trainingsmethoden

Meta heeft verschillende innovatieve methoden gebruikt voor de training van LLAMA 4:

METAP: een techniek voor de robuuste coördinatie van kritieke modelhyperameter
FP8 Precisie: gebruik van 8-bits dia-gemaakte nummers voor efficiënte training
Co-distillatie: gebruik van lama 4 kolos als een lerarenmodel voor kleinere modellen
Volledig asynchrone online leren met versterkingen: een nieuwe infrastructuur voor grootschalig leren

Beschikbaarheid en integratie

De LLAMA 4 -modellen zijn beschikbaar via verschillende platforms en services:

Download en cloudprovider

De modellen Scout en Maverick kunnen rechtstreeks worden gedownload van meta of via knuffelgezicht
Ze zijn ook beschikbaar via verschillende cloudplatforms:
- Cloudflare werknemers ai
- Azure AI Foundry en Azure Databricks
- Google Cloud's Vertex AI
- Andere partners zullen de komende dagen volgen

Integratie in meta -producten

Meta heeft zijn AI -assistenten al bijgewerkt in verschillende platforms op LLAMA 4:

WhatsApp, Messenger en Instagram direct in 40 verschillende landen
De website meta.ai
De multimodale functies zijn momenteel echter alleen beschikbaar voor Engelse -taalgebruikers in de VS.

Geschikt hiervoor:

Meta AI in Duitsland is hier! WhatsApp, Instagram & Facebook krijgen AI-met belangrijke verschillen in de Amerikaanse versie

Licentie en controverse

Hoewel Meta Lama 4 verwijst naar de "open source", zijn er enkele beperkingen in de licentie die de controverse veroorzaakten:

Licentiebeperkingen

De LLAMA 4 community licentie bevat verschillende beperkingen:

Bedrijven met meer dan 700 miljoen maandelijkse actieve gebruikers hebben een speciale licentie van Meta nodig
De modellen mogen blijkbaar geen gebruikers en bedrijven uit de EU gebruiken of distribueren, vermoedelijk vanwege wettelijke vereisten
Er zijn vereisten met betrekking tot naamgeving en toeschrijving voor afgeleide modellen

Debat over "open source"

Er is een debat over de vraag of LLAMA 4 eigenlijk "open source" moet worden genoemd:

Het Open Source -initiatief vond in 2023 dat de beperkingen in de LLA -licentie het uit de categorie 'Open Source' halen
Critici beweren dat het meer een "bron-open" of "met open gewichten" is dan echte open source-software
De licentiebeperkingen kunnen problematisch zijn voor kleine bedrijven zonder hun eigen juridische afdelingen

Toekomstplannen

Meta heeft al enkele inzichten gegeven in zijn toekomstplannen voor Lama 4 en daarna:

Llamacon en andere aankondigingen

Meta organiseert de eerste Llamacon -conferentie op 29 april 2025, waarin verdere details over de AI -modellen en productplannen worden aangekondigd
Het bedrijf is ook van plan om in het tweede kwartaal een speciale aanvraag voor zijn meta-chat-bot te publiceren

Uitbreiding van taalvaardigheden

Meta werkt aan het verbeteren van de taalvaardigheden van Lama 4 om meer natuurlijke gesprekken mogelijk te maken
Het doel is om meer vloeiende, tweezijdige dialogen mogelijk te maken waarin gebruikers het AI-model kunnen onderbreken
Chris Cox, Chief Product Officer van Meta, beschreef de komende LLAMA 4 als een "omni -model" dat moedertaal mogelijk maakt in plaats van taal in tekst te vertalen

Agentische AI en uitgebreide vaardigheden

Mark Zuckerberg heeft aangekondigd dat LLAMA 4 "agentvaardigheden" zal hebben die nieuwe applicaties mogelijk maken
Meta wil AI -modellen ontwikkelen die "gegeneraliseerde acties uitvoeren, natuurlijk communiceren met mensen en uitdagende problemen oplossen"
Het bedrijf overweegt premium -abonnementen aan te bieden voor zijn AI -assistent voor agentdoeleinden zoals reserveringen of videoproductie

Waarom Lama 4 een keerpunt is in het AI -landschap

De publicatie van LLAMA 4 is een belangrijke stap in de metasstrategie om het leidende gebied van de generatieve AI in het zeer competitieve gebied te worden. Met de introductie van de mix van experts -architectuur, native multimodaliteit en een indrukwekkend lang contextvenster toont Meta aan dat open modellen de eigen modellen van de grote technologiebedrijven kunnen bijhouden.

Ondanks de controverse over de licenties en de vraag of LLAMA 4 echt een "open source" moet worden genoemd, is technische vooruitgang een belangrijke mijlpaal. Het vermogen van de modellen om zowel tekst als afbeeldingen te verwerken, biedt nieuwe kansen voor ontwikkelaars en bedrijven.

Met de uitstekende LLAMA 4 Behemoth en de aangekondigde plannen voor uitgebreide taal- en agentvaardigheden, is het duidelijk dat Meta zijn investeringen in AI verder zal intensiveren. De komende maanden zullen laten zien hoe deze nieuwe modellen het AI -landschap veranderen en of, zoals voorspeld door Mark Zuckerberg, ze daadwerkelijk zullen helpen om open AI -modellen te maken op het gebied van kunstmatige intelligentie.

Geschikt hiervoor: