⭐️ Kunsmatige intelligensie (AI) -AI-blog, hotspot en inhoudsentrum ⭐️ Digitale intelligensie ⭐️ Xpaper

Taalkeuse 📢

Meta publiseer New Llama 4 Scout, Maverick en Behemoth

Gepubliseer op: 6 April 2025 / Update van: 6 April 2025 - Skrywer: Konrad Wolfenstein

Meta publiseer New Llama 4 Scout, Maverick en Behemoth-Image: Xpert.digital

LLAMA 4: Die nuwe generasie oop AI -stelsels van Meta

LLAMA 4 onthul: Metas Key tot die volgende AI -era

Meta het die jongste generasie van sy AI -modelle, LLAMA 4, op 5 April 2025 aangebied. Hierdie nuwe modelle verteenwoordig beduidende vordering in die ontwikkeling van oop AI -stelsels en het 'n aantal baanbrekende funksies wat hul prestasie en doeltreffendheid aansienlik verhoog. Die LLAMA 4 -reeks bestaan uit verskillende modelle, waarvan twee reeds in die openbaar beskikbaar is, terwyl die kragtigste model nog in die opleidingsfase is.

Geskik vir:

Eenvoudig verduidelik AI -modelle: verstaan die basiese beginsels van AI, stemmodelle en redenasies

Die Llama 4 -modelfamilie

Meta het drie verskillende modelle in die LLAMA 4 -reeks ontwikkel, wat elk geoptimaliseer is vir verskillende toepassings:

Llama 4 Scout

LLAMA 4 Scout is 'n kompakte model met indrukwekkende tegniese spesifikasies:

17 miljard aktiewe parameters met 16 kundiges (altesaam 109 miljard parameters)
Kan op 'n enkele NVIDIA H100 GPU met Int4 -kwantisering gebruik word
Het 'n merkwaardige groot konteksvenster van 10 miljoen tekens, wat dit een van die eerste oop modelle met hierdie kapasiteit maak

Volgens Meta is Scout meer as ander modelle in sy klas soos Tweeling 3, Gemini 2.0 Flash-Lite en Mistral 3.1. Dit is veral geskik vir take soos die opsomming van lang dokumente, verpersoonliking gebaseer op gebruikersdata en ingewikkelde gevolgtrekkings oor groot hoeveelhede kennis.

Llama 4 maverick

LLAMA 4 Maverick is die kragtiger van die twee beskikbare modelle:

17 miljard aktiewe parameters met 128 kundiges (altesaam 400 miljard parameters)
Die eksperimentele kletsweergawe het Elo 1417 op Lmarena bereik
Oorskry modelle soos GPT-4O en Gemini 2.0 flits in talle maatstawwe

Hierdie model is veral geskik vir algemene hulp en klets -toepassings soos kreatiewe skryfwerk en toon resultate wat vergelykbaar is met Deepseek V3 in redenering en koderingstake, maar met die helfte van die parameters.

Llama 4 behemoth

Llama 4 Behemoth is die kragtigste model van Metas, wat nog nie in die openbaar beskikbaar is nie:

288 miljard aktiewe parameters met 16 kundiges (altesaam byna 2 triljoen parameters)
Volgens meta oorskry dit GPT-4.5, Claude Sonnet 3.7 en Gemini 2.0 Pro vir verskeie STEM-maatstawwe
Dien as 'n 'onderwysermodel' vir die kleiner Llama 4 -modelle

Behemoth is tans nog in die opleidingsfase en word later gepubliseer.

Tegniese innovasies

Die LLAMA 4 -modelreeks stel verskeie belangrike tegniese innovasies bekend wat hul prestasie en doeltreffendheid verbeter:

Mengsel van kundiges (MOE) argitektuur

Een van die belangrikste innovasies by LLAMA 4 is die mengsel van kundiges (MOE) argitektuur, waarin slegs 'n deel van die modelparameters vir elke teken geaktiveer word:

Dit verminder die berekeningspoging en latency aansienlik, terwyl die hoë prestasie behoue bly
By LLAMA 4 Maverick word elke teken deur 'n algemene kundige en een van die 128 geryde kundiges verwerk
Hierdie argitektuur maak dit moontlik om die totale parameter van die model te verhoog sonder om die afleidingskoste te verhoog

Inheemse multimodaliteit met vroeë samesmelting

LLAMA 4 is die eerste oop model met inheemse multimodaliteit deur vroeë samesmelting:

Teks- en beeldtekens word in 'n eenvormige modelargitektuur geïntegreer
Dit stel gesamentlike voorlopige opleiding met groot hoeveelhede teks-, beeld- en videodata moontlik
In teenstelling met LLAMA 3.2, wat afsonderlike parameters vir teks en beelde gebruik het, verstaan LLAMA 4 beide modaliteite inheems met dieselfde parameters

Uiters lang konteksvenster

Die uiters lang konteksvenster van Llama 4 Scout is veral indrukwekkend:

Met 10 miljoen tekens oorskry dit die meeste beskikbare modelle
Dit stel die verwerking van baie lang dokumente, volledige kodebasis of uitgebreide gesprekke in staat
Die irope -argitektuur (onderlose aandaglae) maak dit moontlik

Nuwe opleidingsmetodes

Meta het verskeie innoverende metodes gebruik vir die opleiding van LLAMA 4:

METAP: 'n Tegniek vir die robuuste koördinering van kritieke modelhiperameter
FP8 Presisie: Gebruik van 8-bis-gly-vervaardigde getalle vir doeltreffende opleiding
Mede-distillasie: Gebruik van lama 4 behemoth as onderwysermodel vir kleiner modelle
Volledig asinchroniese aanlynleer met versterkings: 'n nuwe infrastruktuur vir grootskaalse leer

Beskikbaarheid en integrasie

Die LLAMA 4 -modelle is beskikbaar via verskillende platforms en dienste:

Aflaai en wolkverskaffer

Die Models Scout en Maverick kan direk van meta of via 'n drukkie afgelaai word
Dit is ook beskikbaar via verskillende wolkplatforms:
- Cloudflare Workers AI
- Azure AI Foundry en Azure DataBricks
- Google Cloud se Vertex AI
- Ander vennote sal in die komende dae volg

Integrasie in meta -produkte

Meta het sy AI -assistente reeds op verskillende platforms op Llama 4 opgedateer:

WhatsApp, Messenger en Instagram Direct in 40 verskillende lande
Die meta.ai -webwerf
Die multimodale funksies is egter tans slegs beskikbaar vir Engels -taalgebruikers in die VSA

Geskik vir:

Meta ai in Duitsland is hier! WhatsApp, Instagram en Facebook Kry AI-met belangrike verskille in die Amerikaanse weergawe

Lisensie en kontroversie

Alhoewel Meta Llama 4 na die 'open source' verwys, is daar 'n paar beperkings in die lisensie wat kontroversie veroorsaak het:

Lisensiebeperkings

Die LLAMA 4 -gemeenskapslisensie bevat verskeie beperkings:

Maatskappye met meer as 700 miljoen maandelikse aktiewe gebruikers het 'n spesiale lisensie van meta nodig
Die modelle mag blykbaar nie gebruikers en ondernemings van die EU gebruik of versprei nie, vermoedelik as gevolg van regulatoriese vereistes
Daar is vereistes rakende benaming en toeskrywing vir afgeleide modelle

Debat oor “open source”

Daar is 'n debat oor die vraag of Llama 4 eintlik 'open source' genoem moet word:

Die open source -inisiatief het in 2023 bevind dat die beperkings in die LLAMA -lisensie dit uit die kategorie 'Open Source' uithaal
Kritici argumenteer dat dit meer 'n 'bron-oop' of 'met oop gewigte' -model is as regte open source sagteware
Die lisensiebeperkings kan problematies wees vir klein ondernemings sonder hul eie regsdepartemente

Toekomstige planne

Meta het reeds 'n paar insigte gegee oor sy toekomsplanne vir Llama 4 en verder:

Llamacon en ander aankondigings

Meta organiseer die eerste LLAMACON -konferensie op 29 April 2025, waarin verdere besonderhede oor sy AI -modelle en produkplanne aangekondig moet word
Die maatskappy beplan ook om in die tweede kwartaal 'n toegewyde aansoek vir sy Meta-Chat Bot te publiseer

Uitbreiding van taalvaardighede

Meta werk aan die verbetering van Llama 4 se taalvaardighede om meer natuurlike gesprekke moontlik te maak
Die doel is om meer vloeiende, tweesydige dialoë moontlik te maak waarin gebruikers die AI-model kan onderbreek
Chris Cox, hoofprodukbeampte van Meta, het die komende Llama 4 beskryf as 'n 'omni -model' wat moedertaal moontlik maak in plaas daarvan om taal in teks te vertaal

Agentiese AI en uitgebreide vaardighede

Mark Zuckerberg het aangekondig dat Llama 4 'agentvaardighede' sal hê wat nuwe toepassings moet moontlik maak
Meta het ten doel om AI -modelle te ontwikkel wat “algemene optrede uitvoer, natuurlik met mense kommunikeer en uitdagende probleme oplos”
Die maatskappy oorweeg dit om premium -intekeninge vir sy AI -assistent aan te bied vir agentdoeleindes soos besprekings of videoproduksie

Waarom Llama 4 'n keerpunt in die AI -landskap is

Die publikasie van LLAMA 4 is 'n belangrike stap in metas -strategie om die leidende gebied van die generatiewe AI in die uiters mededingende gebied te word. Met die bekendstelling van die mengsel van kundiges -argitektuur, inheemse multimodaliteit en 'n indrukwekkende lang konteksvenster, wys meta dat oop modelle kan tred hou met die eie modelle van die groot tegnologiemaatskappye.

Ondanks die kontroversie oor die lisensiëring en die vraag of daar regtig na Lama 4 verwys moet word as 'n 'open source', is tegniese vooruitgang 'n belangrike mylpaal. Die vermoë van die modelle om teks en beelde te verwerk, bied nuwe geleenthede vir ontwikkelaars en ondernemings.

Met die uitstaande Llama 4 -behemoth en die aangekondigde planne vir uitgebreide taal- en agentvaardighede, is dit duidelik dat Meta sy beleggings in AI verder sal versterk. Die komende maande sal wys hoe hierdie nuwe modelle die AI -landskap verander en of hulle, soos voorspel deur Mark Zuckerberg, eintlik sal help om AI -modelle op die gebied van kunsmatige intelligensie oop te maak.

Geskik vir: