Webwerf-ikoon Xpert.Digitaal

Meta stel nuwe KI-modelreekse Llama 4 Scout, Maverick en Behemoth vry

Meta stel nuwe KI-modelreekse Llama 4 Scout, Maverick en Behemoth vry

Meta stel nuwe KI-modelreeks Llama 4 Scout, Maverick en Behemoth vry ​​– Beeld: Xpert.Digital

Llama 4: Die nuwe generasie oop KI-stelsels van Meta

Llama 4 Onthul: Meta se Sleutel tot die Volgende Era van KI

Op 5 April 2025 het Meta die nuutste generasie van sy KI-modelle, Llama 4, onthul. Hierdie nuwe modelle verteenwoordig 'n beduidende vooruitgang in die ontwikkeling van oop KI-stelsels en beskik oor 'n aantal baanbrekende vermoëns wat hul werkverrigting en doeltreffendheid aansienlik verbeter. Die Llama 4-reeks bestaan ​​uit verskeie modelle, waarvan twee reeds publiek beskikbaar is, terwyl die kragtigste model nog in die opleidingsfase is.

Verwant hieraan:

Die Llama 4-modelfamilie

Meta het drie verskillende modelle in die Llama 4-reeks ontwikkel, elk geoptimaliseer vir verskillende gebruiksgevalle:

Lama 4 Verkenner

Llama 4 Scout is 'n kompakte model met indrukwekkende tegniese spesifikasies:

  • 17 miljard aktiewe parameters met 16 kundiges (’n totaal van 109 miljard parameters)
  • Kan op 'n enkele NVIDIA H100 GPU met Int4-kwantisering bedryf word
  • Dit beskik oor 'n merkwaardig groot konteksvenster van 10 miljoen tokens, wat dit een van die eerste oop modelle met hierdie kapasiteit maak

Volgens Meta oortref Scout ander modelle in sy klas, soos Gemini 3, Gemini 2.0 Flash-Lite en Mistral 3.1. Dit is veral geskik vir take soos die opsomming van lang dokumente, die verpersoonliking van inhoud gebaseer op gebruikersdata en die maak van komplekse gevolgtrekkings uit groot hoeveelhede kennis.

Llama 4 Maverick

Die Llama 4 Maverick is die kragtiger van die twee beskikbare modelle:

  • 17 miljard aktiewe parameters met 128 kundiges (400 miljard parameters in totaal)
  • Die eksperimentele kletsweergawe het ELO 1417 op LMArena bereik
  • Volgens Meta oortref dit modelle soos GPT-4o en Gemini 2.0 Flash in talle maatstawwe

Hierdie model is veral geskik vir algemene hulp- en klets-toepassings soos kreatiewe skryfwerk en toon resultate vergelykbaar met DeepSeek v3 in redenasie- en koderingstake, maar met die helfte van die parameters.

Lama 4 Behemoth

Llama 4 Behemoth is Meta se kragtigste model, maar dit is nog nie publiek beskikbaar nie:

  • 288 miljard aktiewe parameters met 16 kundiges (byna 2 triljoen parameters in totaal)
  • Volgens Meta oortref dit GPT-4.5, Claude Sonnet 3.7 en Gemini 2.0 Pro in verskeie STEM-maatstawwe
  • Dien as 'n "onderwysermodel" vir die kleiner Llama 4-modelle

Behemoth is tans nog in die opleidingsfase en sal op 'n later datum vrygelaat word.

Tegniese innovasies

Die Llama 4-modelreeks stel verskeie beduidende tegniese innovasies bekend wat die werkverrigting en doeltreffendheid daarvan verbeter:

Mengsel van Kenners (MoE) Argitektuur

Een van die belangrikste innovasies in Llama 4 is die Mixture of Experts (MoE) argitektuur, waarin slegs 'n deelversameling van die modelparameters vir elke teken geaktiveer word:

  • Dit verminder berekeningspoging en latensie aansienlik, terwyl hoë werkverrigting gehandhaaf word
  • In Llama 4 Maverick word elke teken verwerk deur 'n gedeelde kenner en een van 128 gerouteerde kenners
  • Hierdie argitektuur maak dit moontlik om die algehele parameters van die model te verhoog sonder om die inferensiekoste te verhoog

Inheemse multimodaliteit met vroeë fusie

Llama 4 is die eerste oop model met inheemse multimodaliteit deur Early Fusion:

  • Teks- en beeldtokens word in 'n verenigde modelargitektuur geïntegreer
  • Dit maak gesamentlike vooropleiding met groot hoeveelhede teks-, beeld- en videodata moontlik
  • Anders as Llama 3.2, wat aparte parameters vir teks en beelde gebruik het, verstaan ​​Llama 4 beide modaliteite inheems met dieselfde parameters

Uiters lang konteksvenster

Die uiters lang konteksvenster van Llama 4 Scout is veral indrukwekkend:

  • Met 10 miljoen tokens oortref dit die meeste beskikbare modelle aansienlik
  • Dit maak die verwerking van baie lang dokumente, hele kodebasisse of uitgebreide gesprekke moontlik
  • Die iRoPE-argitektuur (interleaved attention layers) maak dit moontlik

Nuwe opleidingsmetodes

Meta het verskeie innoverende metodes gebruik vir die opleiding van Llama 4:

  • MetaP: 'n Tegniek vir die robuuste afstemming van kritieke modelhiperparameters
  • FP8-presisie: Gebruik van 8-bis drywende-komma-getalle vir doeltreffende opleiding
  • Ko-distillasie: Gebruik van Llama 4 Behemoth as 'n onderwysermodel vir kleiner modelle
  • Volledig asynchrone aanlynleer met versterking: 'n Nuwe infrastruktuur vir grootskaalse leer

Beskikbaarheid en integrasie

Die Llama 4-modelle is beskikbaar deur verskeie platforms en dienste:

Aflaai- en wolkverskaffers

  • Die Scout- en Maverick-modelle kan direk vanaf Meta of via Hugging Face afgelaai word
  • Hulle is ook beskikbaar via verskeie wolkplatforms:
    • Cloudflare Werkers KI
    • Azure KI Foundry en Azure Databricks
    • Google Cloud se Vertex KI
    • Meer vennote sal in die komende dae volg

Integrasie in metaprodukte

Meta het reeds sy KI-assistente na Llama 4 oor verskeie platforms opgedateer:

  • WhatsApp, Messenger en Instagram Direct in 40 verskillende lande
  • Die Meta.AI webwerf
  • Die multimodale funksies is egter tans slegs beskikbaar vir Engelssprekende gebruikers in die VSA

Verwant hieraan:

Lisensiëring en kontroversies

Alhoewel Meta Llama 4 as "oopbron" beskryf word, is daar 'n paar beperkings in die lisensie wat kontroversie veroorsaak het:

Lisensiebeperkings

Die Llama 4 Gemeenskapslisensie bevat verskeie beperkings:

  • Maatskappye met meer as 700 miljoen maandelikse aktiewe gebruikers benodig 'n spesiale lisensie van Meta
  • Gebruikers en maatskappye van die EU word blykbaar nie toegelaat om die modelle te gebruik of te versprei nie, vermoedelik weens regulatoriese vereistes
  • Daar is vereistes rakende die benaming en toeskrywing van afgeleide modelle

Debat oor "Oopbron"

Daar is 'n debat oor of Llama 4 eintlik "Open Source" genoem moet word:

  • Die Open Source Initiative het in 2023 bepaal dat die beperkings in die Llama-lisensie dit “uit die 'Oopbron'-kategorie” haal
  • Kritici voer aan dat dit meer van 'n "bron-oop" of "oop-gewigte" model is as ware oopbron sagteware
  • Die lisensiëringsbeperkings kan problematies wees vir klein besighede sonder hul eie regsafdelings

Toekomsplanne

Meta het reeds insigte gegee in sy toekomsplanne vir Llama 4 en verder:

LlamaCon en ander aankondigings

  • Meta sal sy eerste LlamaCon-konferensie op 29 April 2025 aanbied, waar verdere besonderhede oor sy KI-modelle en produkplanne aangekondig sal word
  • Die maatskappy beplan ook om in die tweede kwartaal 'n toegewyde toepassing vir sy meta-kletsbot vry te stel

Uitbreiding van taalvaardighede

  • Meta werk daaraan om Llama 4 se taalvaardighede te verbeter om meer natuurlike gesprekke moontlik te maak
  • Die doel is om gladder, tweerigting-dialoë moontlik te maak waar gebruikers die KI-model kan onderbreek
  • Chris Cox, hoofprodukbeampte van Meta, het die komende Llama 4 beskryf as 'n "omni-model" wat moedertaal moontlik maak in plaas van om spraak na teks te vertaal

Agentiese KI en verbeterde vermoëns

  • Mark Zuckerberg het aangekondig dat Llama 4 "agentskapvermoëns" sal hê wat nuwe gebruiksgevalle moontlik sal maak
  • Meta poog om KI-modelle te ontwikkel wat "veralgemeende aksies kan uitvoer, natuurlik met mense kan kommunikeer en uitdagende probleme kan oplos."
  • Die maatskappy oorweeg dit om premium-intekeninge vir sy KI-assistent aan te bied vir agentverwante doeleindes soos besprekings of videoproduksie

Waarom Llama 4 'n keerpunt in die KI-landskap is

Die vrystelling van Llama 4 verteenwoordig 'n belangrike stap in Meta se strategie om 'n leier te word in die hoogs mededingende veld van generatiewe KI. Met die bekendstelling van die Mixture of Experts-argitektuur, inheemse multimodaliteit en 'n indrukwekkend lang konteksvenster, demonstreer Meta dat oop modelle kan meeding met die eie modelle van groot tegnologiemaatskappye.

Ten spyte van die kontroversies rondom lisensiëring en die vraag of Llama 4 werklik "oopbron" genoem moet word, verteenwoordig die tegniese vooruitgang 'n belangrike mylpaal. Die modelle se vermoë om beide teks en beelde te verwerk, bied nuwe moontlikhede vir ontwikkelaars en besighede.

Met die Llama 4 Behemoth nog hangende en die aangekondigde planne vir verbeterde taal- en agentvermoëns, is dit duidelik dat Meta sy beleggings in KI verder sal intensiveer. Die komende maande sal wys hoe hierdie nuwe modelle die KI-landskap sal transformeer en of hulle inderdaad, soos Mark Zuckerberg voorspel het, oop KI-modelle sal help om die toonaangewende krag in kunsmatige intelligensie te word.

Verwant hieraan:

 

Jou wêreldwye bemarkings- en sake-ontwikkelingsvennoot

☑️ Ons besigheidstaal is Engels of Duits

☑️ NUUT: Korrespondensie in jou moedertaal!

 

Konrad Wolfenstein

Ek en my span is bly om as jou persoonlike adviseur vir jou beskikbaar te wees.

Jy kan my kontak deur die kontakvorm hier in te vul wolfenstein@xpert.digital:of my eenvoudig te skakel by +49 7348 4088 965. My e-posadres is

Ek sien uit na ons gesamentlike projek.

 

 

☑️ KMO-ondersteuning in strategie, konsultasie, beplanning en implementering

☑️ Skepping of herbelyning van die digitale strategie en digitalisering

☑️ Uitbreiding en optimalisering van internasionale verkoopsprosesse

☑️ Globale en digitale B2B-handelsplatforms

☑️ Pionier Besigheidsontwikkeling / Bemarking / PR / Handelskoue

Verlaat die mobiele weergawe