Gepubliseer op: 6 April 2025 / Update van: 6 April 2025 - Skrywer: Konrad Wolfenstein
LLAMA 4: Die nuwe generasie oop AI -stelsels van Meta
LLAMA 4 onthul: Metas Key tot die volgende AI -era
Meta het die jongste generasie van sy AI -modelle, LLAMA 4, op 5 April 2025 aangebied. Hierdie nuwe modelle verteenwoordig beduidende vordering in die ontwikkeling van oop AI -stelsels en het 'n aantal baanbrekende funksies wat hul prestasie en doeltreffendheid aansienlik verhoog. Die LLAMA 4 -reeks bestaan uit verskillende modelle, waarvan twee reeds in die openbaar beskikbaar is, terwyl die kragtigste model nog in die opleidingsfase is.
Geskik vir:
- Eenvoudig verduidelik AI -modelle: verstaan die basiese beginsels van AI, stemmodelle en redenasies
Die Llama 4 -modelfamilie
Meta het drie verskillende modelle in die LLAMA 4 -reeks ontwikkel, wat elk geoptimaliseer is vir verskillende toepassings:
Llama 4 Scout
LLAMA 4 Scout is 'n kompakte model met indrukwekkende tegniese spesifikasies:
- 17 miljard aktiewe parameters met 16 kundiges (altesaam 109 miljard parameters)
- Kan op 'n enkele NVIDIA H100 GPU met Int4 -kwantisering gebruik word
- Het 'n merkwaardige groot konteksvenster van 10 miljoen tekens, wat dit een van die eerste oop modelle met hierdie kapasiteit maak
Volgens Meta is Scout meer as ander modelle in sy klas soos Tweeling 3, Gemini 2.0 Flash-Lite en Mistral 3.1. Dit is veral geskik vir take soos die opsomming van lang dokumente, verpersoonliking gebaseer op gebruikersdata en ingewikkelde gevolgtrekkings oor groot hoeveelhede kennis.
Llama 4 maverick
LLAMA 4 Maverick is die kragtiger van die twee beskikbare modelle:
- 17 miljard aktiewe parameters met 128 kundiges (altesaam 400 miljard parameters)
- Die eksperimentele kletsweergawe het Elo 1417 op Lmarena bereik
- Oorskry modelle soos GPT-4O en Gemini 2.0 flits in talle maatstawwe
Hierdie model is veral geskik vir algemene hulp en klets -toepassings soos kreatiewe skryfwerk en toon resultate wat vergelykbaar is met Deepseek V3 in redenering en koderingstake, maar met die helfte van die parameters.
Llama 4 behemoth
Llama 4 Behemoth is die kragtigste model van Metas, wat nog nie in die openbaar beskikbaar is nie:
- 288 miljard aktiewe parameters met 16 kundiges (altesaam byna 2 triljoen parameters)
- Volgens meta oorskry dit GPT-4.5, Claude Sonnet 3.7 en Gemini 2.0 Pro vir verskeie STEM-maatstawwe
- Dien as 'n 'onderwysermodel' vir die kleiner Llama 4 -modelle
Behemoth is tans nog in die opleidingsfase en word later gepubliseer.
Tegniese innovasies
Die LLAMA 4 -modelreeks stel verskeie belangrike tegniese innovasies bekend wat hul prestasie en doeltreffendheid verbeter:
Mengsel van kundiges (MOE) argitektuur
Een van die belangrikste innovasies by LLAMA 4 is die mengsel van kundiges (MOE) argitektuur, waarin slegs 'n deel van die modelparameters vir elke teken geaktiveer word:
- Dit verminder die berekeningspoging en latency aansienlik, terwyl die hoë prestasie behoue bly
- By LLAMA 4 Maverick word elke teken deur 'n algemene kundige en een van die 128 geryde kundiges verwerk
- Hierdie argitektuur maak dit moontlik om die totale parameter van die model te verhoog sonder om die afleidingskoste te verhoog
Inheemse multimodaliteit met vroeë samesmelting
LLAMA 4 is die eerste oop model met inheemse multimodaliteit deur vroeë samesmelting:
- Teks- en beeldtekens word in 'n eenvormige modelargitektuur geïntegreer
- Dit stel gesamentlike voorlopige opleiding met groot hoeveelhede teks-, beeld- en videodata moontlik
- In teenstelling met LLAMA 3.2, wat afsonderlike parameters vir teks en beelde gebruik het, verstaan LLAMA 4 beide modaliteite inheems met dieselfde parameters
Uiters lang konteksvenster
Die uiters lang konteksvenster van Llama 4 Scout is veral indrukwekkend:
- Met 10 miljoen tekens oorskry dit die meeste beskikbare modelle
- Dit stel die verwerking van baie lang dokumente, volledige kodebasis of uitgebreide gesprekke in staat
- Die irope -argitektuur (onderlose aandaglae) maak dit moontlik
Nuwe opleidingsmetodes
Meta het verskeie innoverende metodes gebruik vir die opleiding van LLAMA 4:
- METAP: 'n Tegniek vir die robuuste koördinering van kritieke modelhiperameter
- FP8 Presisie: Gebruik van 8-bis-gly-vervaardigde getalle vir doeltreffende opleiding
- Mede-distillasie: Gebruik van lama 4 behemoth as onderwysermodel vir kleiner modelle
- Volledig asinchroniese aanlynleer met versterkings: 'n nuwe infrastruktuur vir grootskaalse leer
Beskikbaarheid en integrasie
Die LLAMA 4 -modelle is beskikbaar via verskillende platforms en dienste:
Aflaai en wolkverskaffer
- Die Models Scout en Maverick kan direk van meta of via 'n drukkie afgelaai word
- Dit is ook beskikbaar via verskillende wolkplatforms:
- Cloudflare Workers AI
- Azure AI Foundry en Azure DataBricks
- Google Cloud se Vertex AI
- Ander vennote sal in die komende dae volg
Integrasie in meta -produkte
Meta het sy AI -assistente reeds op verskillende platforms op Llama 4 opgedateer:
- WhatsApp, Messenger en Instagram Direct in 40 verskillende lande
- Die meta.ai -webwerf
- Die multimodale funksies is egter tans slegs beskikbaar vir Engels -taalgebruikers in die VSA
Geskik vir:
- Meta ai in Duitsland is hier! WhatsApp, Instagram en Facebook Kry AI-met belangrike verskille in die Amerikaanse weergawe
Lisensie en kontroversie
Alhoewel Meta Llama 4 na die 'open source' verwys, is daar 'n paar beperkings in die lisensie wat kontroversie veroorsaak het:
Lisensiebeperkings
Die LLAMA 4 -gemeenskapslisensie bevat verskeie beperkings:
- Maatskappye met meer as 700 miljoen maandelikse aktiewe gebruikers het 'n spesiale lisensie van meta nodig
- Die modelle mag blykbaar nie gebruikers en ondernemings van die EU gebruik of versprei nie, vermoedelik as gevolg van regulatoriese vereistes
- Daar is vereistes rakende benaming en toeskrywing vir afgeleide modelle
Debat oor “open source”
Daar is 'n debat oor die vraag of Llama 4 eintlik 'open source' genoem moet word:
- Die open source -inisiatief het in 2023 bevind dat die beperkings in die LLAMA -lisensie dit uit die kategorie 'Open Source' uithaal
- Kritici argumenteer dat dit meer 'n 'bron-oop' of 'met oop gewigte' -model is as regte open source sagteware
- Die lisensiebeperkings kan problematies wees vir klein ondernemings sonder hul eie regsdepartemente
Toekomstige planne
Meta het reeds 'n paar insigte gegee oor sy toekomsplanne vir Llama 4 en verder:
Llamacon en ander aankondigings
- Meta organiseer die eerste LLAMACON -konferensie op 29 April 2025, waarin verdere besonderhede oor sy AI -modelle en produkplanne aangekondig moet word
- Die maatskappy beplan ook om in die tweede kwartaal 'n toegewyde aansoek vir sy Meta-Chat Bot te publiseer
Uitbreiding van taalvaardighede
- Meta werk aan die verbetering van Llama 4 se taalvaardighede om meer natuurlike gesprekke moontlik te maak
- Die doel is om meer vloeiende, tweesydige dialoë moontlik te maak waarin gebruikers die AI-model kan onderbreek
- Chris Cox, hoofprodukbeampte van Meta, het die komende Llama 4 beskryf as 'n 'omni -model' wat moedertaal moontlik maak in plaas daarvan om taal in teks te vertaal
Agentiese AI en uitgebreide vaardighede
- Mark Zuckerberg het aangekondig dat Llama 4 'agentvaardighede' sal hê wat nuwe toepassings moet moontlik maak
- Meta het ten doel om AI -modelle te ontwikkel wat “algemene optrede uitvoer, natuurlik met mense kommunikeer en uitdagende probleme oplos”
- Die maatskappy oorweeg dit om premium -intekeninge vir sy AI -assistent aan te bied vir agentdoeleindes soos besprekings of videoproduksie
Waarom Llama 4 'n keerpunt in die AI -landskap is
Die publikasie van LLAMA 4 is 'n belangrike stap in metas -strategie om die leidende gebied van die generatiewe AI in die uiters mededingende gebied te word. Met die bekendstelling van die mengsel van kundiges -argitektuur, inheemse multimodaliteit en 'n indrukwekkende lang konteksvenster, wys meta dat oop modelle kan tred hou met die eie modelle van die groot tegnologiemaatskappye.
Ondanks die kontroversie oor die lisensiëring en die vraag of daar regtig na Lama 4 verwys moet word as 'n 'open source', is tegniese vooruitgang 'n belangrike mylpaal. Die vermoë van die modelle om teks en beelde te verwerk, bied nuwe geleenthede vir ontwikkelaars en ondernemings.
Met die uitstaande Llama 4 -behemoth en die aangekondigde planne vir uitgebreide taal- en agentvaardighede, is dit duidelik dat Meta sy beleggings in AI verder sal versterk. Die komende maande sal wys hoe hierdie nuwe modelle die AI -landskap verander en of hulle, soos voorspel deur Mark Zuckerberg, eintlik sal help om AI -modelle op die gebied van kunsmatige intelligensie oop te maak.
Geskik vir:
Jou globale bemarkings- en besigheidsontwikkelingsvennoot
☑️ Ons besigheidstaal is Engels of Duits
☑️ NUUT: Korrespondensie in jou landstaal!
Ek sal graag jou en my span as 'n persoonlike adviseur dien.
Jy kan my kontak deur die kontakvorm hier in te vul of bel my eenvoudig by +49 89 89 674 804 (München) . My e-posadres is: wolfenstein ∂ xpert.digital
Ek sien uit na ons gesamentlike projek.