Llama 4: Die nuwe generasie oop KI-stelsels van Meta
Llama 4 Onthul: Meta se Sleutel tot die Volgende Era van KI
Op 5 April 2025 het Meta die nuutste generasie van sy KI-modelle, Llama 4, onthul. Hierdie nuwe modelle verteenwoordig 'n beduidende vooruitgang in die ontwikkeling van oop KI-stelsels en beskik oor 'n aantal baanbrekende vermoëns wat hul werkverrigting en doeltreffendheid aansienlik verbeter. Die Llama 4-reeks bestaan uit verskeie modelle, waarvan twee reeds publiek beskikbaar is, terwyl die kragtigste model nog in die opleidingsfase is.
Verwant hieraan:
Die Llama 4-modelfamilie
Meta het drie verskillende modelle in die Llama 4-reeks ontwikkel, elk geoptimaliseer vir verskillende gebruiksgevalle:
Lama 4 Verkenner
Llama 4 Scout is 'n kompakte model met indrukwekkende tegniese spesifikasies:
- 17 miljard aktiewe parameters met 16 kundiges (’n totaal van 109 miljard parameters)
- Kan op 'n enkele NVIDIA H100 GPU met Int4-kwantisering bedryf word
- Dit beskik oor 'n merkwaardig groot konteksvenster van 10 miljoen tokens, wat dit een van die eerste oop modelle met hierdie kapasiteit maak
Volgens Meta oortref Scout ander modelle in sy klas, soos Gemini 3, Gemini 2.0 Flash-Lite en Mistral 3.1. Dit is veral geskik vir take soos die opsomming van lang dokumente, die verpersoonliking van inhoud gebaseer op gebruikersdata en die maak van komplekse gevolgtrekkings uit groot hoeveelhede kennis.
Llama 4 Maverick
Die Llama 4 Maverick is die kragtiger van die twee beskikbare modelle:
- 17 miljard aktiewe parameters met 128 kundiges (400 miljard parameters in totaal)
- Die eksperimentele kletsweergawe het ELO 1417 op LMArena bereik
- Volgens Meta oortref dit modelle soos GPT-4o en Gemini 2.0 Flash in talle maatstawwe
Hierdie model is veral geskik vir algemene hulp- en klets-toepassings soos kreatiewe skryfwerk en toon resultate vergelykbaar met DeepSeek v3 in redenasie- en koderingstake, maar met die helfte van die parameters.
Lama 4 Behemoth
Llama 4 Behemoth is Meta se kragtigste model, maar dit is nog nie publiek beskikbaar nie:
- 288 miljard aktiewe parameters met 16 kundiges (byna 2 triljoen parameters in totaal)
- Volgens Meta oortref dit GPT-4.5, Claude Sonnet 3.7 en Gemini 2.0 Pro in verskeie STEM-maatstawwe
- Dien as 'n "onderwysermodel" vir die kleiner Llama 4-modelle
Behemoth is tans nog in die opleidingsfase en sal op 'n later datum vrygelaat word.
Tegniese innovasies
Die Llama 4-modelreeks stel verskeie beduidende tegniese innovasies bekend wat die werkverrigting en doeltreffendheid daarvan verbeter:
Mengsel van Kenners (MoE) Argitektuur
Een van die belangrikste innovasies in Llama 4 is die Mixture of Experts (MoE) argitektuur, waarin slegs 'n deelversameling van die modelparameters vir elke teken geaktiveer word:
- Dit verminder berekeningspoging en latensie aansienlik, terwyl hoë werkverrigting gehandhaaf word
- In Llama 4 Maverick word elke teken verwerk deur 'n gedeelde kenner en een van 128 gerouteerde kenners
- Hierdie argitektuur maak dit moontlik om die algehele parameters van die model te verhoog sonder om die inferensiekoste te verhoog
Inheemse multimodaliteit met vroeë fusie
Llama 4 is die eerste oop model met inheemse multimodaliteit deur Early Fusion:
- Teks- en beeldtokens word in 'n verenigde modelargitektuur geïntegreer
- Dit maak gesamentlike vooropleiding met groot hoeveelhede teks-, beeld- en videodata moontlik
- Anders as Llama 3.2, wat aparte parameters vir teks en beelde gebruik het, verstaan Llama 4 beide modaliteite inheems met dieselfde parameters
Uiters lang konteksvenster
Die uiters lang konteksvenster van Llama 4 Scout is veral indrukwekkend:
- Met 10 miljoen tokens oortref dit die meeste beskikbare modelle aansienlik
- Dit maak die verwerking van baie lang dokumente, hele kodebasisse of uitgebreide gesprekke moontlik
- Die iRoPE-argitektuur (interleaved attention layers) maak dit moontlik
Nuwe opleidingsmetodes
Meta het verskeie innoverende metodes gebruik vir die opleiding van Llama 4:
- MetaP: 'n Tegniek vir die robuuste afstemming van kritieke modelhiperparameters
- FP8-presisie: Gebruik van 8-bis drywende-komma-getalle vir doeltreffende opleiding
- Ko-distillasie: Gebruik van Llama 4 Behemoth as 'n onderwysermodel vir kleiner modelle
- Volledig asynchrone aanlynleer met versterking: 'n Nuwe infrastruktuur vir grootskaalse leer
Beskikbaarheid en integrasie
Die Llama 4-modelle is beskikbaar deur verskeie platforms en dienste:
Aflaai- en wolkverskaffers
- Die Scout- en Maverick-modelle kan direk vanaf Meta of via Hugging Face afgelaai word
- Hulle is ook beskikbaar via verskeie wolkplatforms:
- Cloudflare Werkers KI
- Azure KI Foundry en Azure Databricks
- Google Cloud se Vertex KI
- Meer vennote sal in die komende dae volg
Integrasie in metaprodukte
Meta het reeds sy KI-assistente na Llama 4 oor verskeie platforms opgedateer:
- WhatsApp, Messenger en Instagram Direct in 40 verskillende lande
- Die Meta.AI webwerf
- Die multimodale funksies is egter tans slegs beskikbaar vir Engelssprekende gebruikers in die VSA
Verwant hieraan:
- Meta KI is hier in Duitsland! WhatsApp, Instagram en Facebook kry KI – met belangrike verskille van die Amerikaanse weergawe.
Lisensiëring en kontroversies
Alhoewel Meta Llama 4 as "oopbron" beskryf word, is daar 'n paar beperkings in die lisensie wat kontroversie veroorsaak het:
Lisensiebeperkings
Die Llama 4 Gemeenskapslisensie bevat verskeie beperkings:
- Maatskappye met meer as 700 miljoen maandelikse aktiewe gebruikers benodig 'n spesiale lisensie van Meta
- Gebruikers en maatskappye van die EU word blykbaar nie toegelaat om die modelle te gebruik of te versprei nie, vermoedelik weens regulatoriese vereistes
- Daar is vereistes rakende die benaming en toeskrywing van afgeleide modelle
Debat oor "Oopbron"
Daar is 'n debat oor of Llama 4 eintlik "Open Source" genoem moet word:
- Die Open Source Initiative het in 2023 bepaal dat die beperkings in die Llama-lisensie dit “uit die 'Oopbron'-kategorie” haal
- Kritici voer aan dat dit meer van 'n "bron-oop" of "oop-gewigte" model is as ware oopbron sagteware
- Die lisensiëringsbeperkings kan problematies wees vir klein besighede sonder hul eie regsafdelings
Toekomsplanne
Meta het reeds insigte gegee in sy toekomsplanne vir Llama 4 en verder:
LlamaCon en ander aankondigings
- Meta sal sy eerste LlamaCon-konferensie op 29 April 2025 aanbied, waar verdere besonderhede oor sy KI-modelle en produkplanne aangekondig sal word
- Die maatskappy beplan ook om in die tweede kwartaal 'n toegewyde toepassing vir sy meta-kletsbot vry te stel
Uitbreiding van taalvaardighede
- Meta werk daaraan om Llama 4 se taalvaardighede te verbeter om meer natuurlike gesprekke moontlik te maak
- Die doel is om gladder, tweerigting-dialoë moontlik te maak waar gebruikers die KI-model kan onderbreek
- Chris Cox, hoofprodukbeampte van Meta, het die komende Llama 4 beskryf as 'n "omni-model" wat moedertaal moontlik maak in plaas van om spraak na teks te vertaal
Agentiese KI en verbeterde vermoëns
- Mark Zuckerberg het aangekondig dat Llama 4 "agentskapvermoëns" sal hê wat nuwe gebruiksgevalle moontlik sal maak
- Meta poog om KI-modelle te ontwikkel wat "veralgemeende aksies kan uitvoer, natuurlik met mense kan kommunikeer en uitdagende probleme kan oplos."
- Die maatskappy oorweeg dit om premium-intekeninge vir sy KI-assistent aan te bied vir agentverwante doeleindes soos besprekings of videoproduksie
Waarom Llama 4 'n keerpunt in die KI-landskap is
Die vrystelling van Llama 4 verteenwoordig 'n belangrike stap in Meta se strategie om 'n leier te word in die hoogs mededingende veld van generatiewe KI. Met die bekendstelling van die Mixture of Experts-argitektuur, inheemse multimodaliteit en 'n indrukwekkend lang konteksvenster, demonstreer Meta dat oop modelle kan meeding met die eie modelle van groot tegnologiemaatskappye.
Ten spyte van die kontroversies rondom lisensiëring en die vraag of Llama 4 werklik "oopbron" genoem moet word, verteenwoordig die tegniese vooruitgang 'n belangrike mylpaal. Die modelle se vermoë om beide teks en beelde te verwerk, bied nuwe moontlikhede vir ontwikkelaars en besighede.
Met die Llama 4 Behemoth nog hangende en die aangekondigde planne vir verbeterde taal- en agentvermoëns, is dit duidelik dat Meta sy beleggings in KI verder sal intensiveer. Die komende maande sal wys hoe hierdie nuwe modelle die KI-landskap sal transformeer en of hulle inderdaad, soos Mark Zuckerberg voorspel het, oop KI-modelle sal help om die toonaangewende krag in kunsmatige intelligensie te word.
Verwant hieraan:
Jou wêreldwye bemarkings- en sake-ontwikkelingsvennoot
☑️ Ons besigheidstaal is Engels of Duits
☑️ NUUT: Korrespondensie in jou moedertaal!
Ek en my span is bly om as jou persoonlike adviseur vir jou beskikbaar te wees.
Jy kan my kontak deur die kontakvorm hier in te vul wolfenstein@xpert.digital:of my eenvoudig te skakel by +49 7348 4088 965. My e-posadres is
Ek sien uit na ons gesamentlike projek.


