Häälevalik 📢


Meta avaldab New Lalama 4 Scout, Maverick ja Behemoth

Avaldatud: 6. aprill 2025 / UPDATE FROM: 6. aprill 2025 - autor: Konrad Wolfenstein

Meta avaldab New Lalama 4 Scout, Maverick ja Behemoth

Meta avaldab New Lalama 4 Scout, Maverick ja Behemoth-Image: Xpert.digital

Laama 4: meta avatud AI -süsteemide uus põlvkond

Laama 4 paljastas: järgmise AI vanuse metas võti

Meta esitas oma AI -mudelite viimasele põlvkonnale, laama 4, 5. aprillil 2025. Need uued mudelid esindavad märkimisväärset edu avatud AI -süsteemide arendamisel ja neil on mitmeid murrangulisi funktsioone, mis suurendavad nende jõudlust ja tõhusust märkimisväärselt. Llama 4 seeria koosneb erinevatest mudelitest, millest kaks on juba avalikult saadaval, samas kui kõige võimsam mudel on endiselt treeningfaasis.

Sobib selleks:

Lalama 4 mudeliperekond

Meta on välja töötanud kolm erinevat mudelit LEMA 4 -seerias, millest igaüks on optimeeritud erinevate rakenduste jaoks:

Lalama 4 skaut

Lalama 4 Scout on kompaktne mudel, millel on muljetavaldavad tehnilised spetsifikatsioonid:

  • 17 miljardit aktiivset parameetrit 16 eksperdiga (kokku 109 miljardit parameetrit)
  • Saab kasutada ühel NVIDIA H100 GPU -l koos INT4 kvantimisega
  • Sellel on märkimisväärselt suur kontekstiaken, mis on 10 miljonit žetooni, mis teeb sellest ühe esimestest avatud mudelitest, millel on

Meta sõnul ületab Scout oma klassis muid mudeleid nagu Gemini 3, Kaksikud 2.0 Flash-Lite ja Mistral 3.1. See sobib eriti selliste ülesannete jaoks nagu pikkade dokumentide kokkuvõte, isikuandmetel põhinev isikupärastamine ja keerukad järeldused suures koguses teadmiste kohta.

Laama 4 Maverick

Lalama 4 Maverick on kahest saadaolevast mudelist võimsam:

  • 17 miljardit aktiivset parameetrit 128 eksperdiga (kokku 400 miljardit parameetrit)
  • Eksperimentaalne vestlusversioon jõudis Lmarenas ELO 1417 -le
  • Ületab selliseid mudeleid nagu GPT-4O ja Kaksikud 2.0 arvukates võrdlusalustes

See mudel sobib eriti üldiseks abi- ja vestlusrakendusteks, näiteks loominguline kirjutamine ning näitab tulemusi, mis on võrreldavad Deepseek V3 -ga mõttekäikude ja kodeerimise ülesannete osas, kuid poole parameetritega.

Laama 4 behemoth

Laama 4 Behemoth on Metase kõige võimsam mudel, mis pole veel avalikult kättesaadav:

  • 288 miljardit aktiivset parameetrit 16 eksperdiga (kokku peaaegu 2 triljonit parameetrit)
  • Meta sõnul ületab see mitme varre võrdlusaluse jaoks GPT-4,5, Claude Sonnet 3.7 ja Gemini 2.0 Pro
  • Toimib väiksemate laama 4 mudelite „õpetajamudel”

Behemoth on praegu endiselt koolitusfaasis ja see avaldatakse hiljem.

Tehnilised uuendused

Llama 4 mudelisari tutvustab mitmeid olulisi tehnilisi uuendusi, mis parandavad nende jõudlust ja tõhusust:

Ekspertide segu (MOE) arhitektuur

Üks olulisemaid uuendusi LEMA 4 -s on ekspertide (MOE) arhitektuuri segu, milles aktiveeritakse ainult osa mudeli parameetritest iga märgi jaoks:

  • See vähendab märkimisväärselt arvutuste jõupingutusi ja latentsusaega, samal ajal kui kõrge jõudlus on säilinud
  • Laama 4 Maverickis töötleb iga sümbol ühine ekspert ja üks 128 gerseeritud eksperdist
  • See arhitektuur võimaldab suurendada mudeli kogu parameetrit, suurendamata järelduskulusid

Looduslik multimodaalsus varase sulandumisega

Lalama 4 on esimene avatud multimodaalsusega avatud mudel varajase sulandumisega:

  • Teksti- ja pildimärgid on integreeritud ühtsesse mudeli arhitektuuri
  • See võimaldab ühist koolitust suures koguses teksti-, pildi- ja videoandmetega
  • Vastupidiselt laama 3.2 -le, mis kasutas teksti ja piltide jaoks eraldi parameetreid

Äärmiselt pikk konteksti aken

Eriti muljetavaldav on Llama 4 skaudi äärmiselt pikk konteksti aken:

  • 10 miljoni žetooniga ületab see selgelt enamikku saadaolevatest mudelitest
  • See võimaldab töötleda väga pikki dokumente, terveid koodi aluseid või ulatuslikke vestlusi
  • Irope arhitektuur (põimitud tähelepanu kihid) võimaldab

Uued koolitusmeetodid

Meta on laama 4 koolitamiseks kasutanud mitmeid uuenduslikke meetodeid:

  • Metap: kriitilise mudeli hüperameetri tugeva koordineerimise tehnika
  • FP8 täpsus: 8-bitiste slaidist valmistatud numbrite kasutamine tõhusaks treeninguks
  • Kaasatus: laama 4 behemothi kasutamine õpetajamudelina väiksemate mudelite jaoks
  • Täielikult asünkroonne veebis õppimine tugevdustega: uus infrastruktuur suuremahuliseks õppimiseks

Saadavus ja integratsioon

LEMA 4 mudelid on saadaval erinevate platvormide ja teenuste kaudu:

Laadige alla ja pilveteenuse pakkuja

  • Mudeli skaudi ja Mavericki saab alla laadida otse metast või kallistava näo kaudu
  • Need on saadaval ka erinevate pilveplatvormide kaudu:
    • CloudFlare'i töötajad AI
    • Azure AI valukoda ja Azure'i andmebricks
    • Google Cloud tippu AI
    • Teised partnerid järgnevad lähipäevil

Integreerimine metatoodetesse

Meta on juba värskendanud oma AI assistente erinevatel platvormidel laamas 4:

  • WhatsApp, Messenger ja Instagram Direct 40 erinevas riigis
  • Meta.ai veebisait
  • Kuid multimodaalsed funktsioonid on praegu saadaval ainult ingliskeelsetele kasutajatele USA -s

Sobib selleks:

Litsents ja poleemika

Ehkki Meta Llama 4 viitab avatud lähtekoodiga, on litsentsil vaidluse põhjustatud piirangud:

Litsentsipiirangud

LEMA 4 kogukonna litsents sisaldab mitmeid piiranguid:

  • Enam kui 700 miljoni igakuise aktiivse kasutajaga ettevõtted vajavad metalt spetsiaalset litsentsi
  • Ilmselt ei lubata mudelitel kasutada ega levitada EL -i kasutajaid ja ettevõtteid, arvatavasti regulatiivsete nõuete tõttu
  • Tuletatud mudelite nimetamise ja omistamise osas on nõuded

Arutelu “avatud lähtekoodi” üle

On arutelu selle üle, kas laama 4 tuleks tegelikult nimetada “avatud lähtekoodiga”:

  • Avatud lähtekoodiga algatus leidis 2023. aastal, et LEMA litsentsi piirangud võtavad selle välja kategooria „avatud lähtekoodiga”
  • Kriitikud väidavad, et see on pigem mudel „allikas” või „avatud raskustega” kui päris avatud lähtekoodiga tarkvara
  • Litsentsipiirangud võivad olla väikeste ettevõtete jaoks problemaatilised ilma oma juriidiliste osakondadeta

Tulevikuplaanid

Meta on juba andnud ülevaate oma tulevikuplaanidest laama 4 ja pärast seda:

Llamacon ja muud teadaanded

  • Meta korraldab 29. aprillil 2025 esimese LlamaConi konverentsi, kus lisateavet AI mudelite ja tooteplaanide kohta tuleb välja kuulutada
  • Samuti kavatseb ettevõte teises kvartalis avaldada oma meta-chat-boti jaoks spetsiaalse taotluse

Keeleoskuse laiendamine

  • Meta tegeleb LEMA 4 keeleoskuse parandamisega, et võimaldada loomulikumaid vestlusi
  • Eesmärk on lubada rohkem sujuvaid, kahepoolseid dialooge, milles kasutajad saavad AI mudeli katkestada
  • Meta tootejuht Chris Cox kirjeldas eelseisvat Llama 4 -d kui “Omni mudelit”, mis võimaldab emakeelt, selle asemel et keele teksti tõlkida

Agent AI ja laiendatud oskused

  • Mark Zuckerberg on teatanud, et LEMA 4 -l on agendioskus, mis peaks võimaldama uusi rakendusi
  • Meta eesmärk on välja töötada AI -mudelid, mis "teostavad üldistatud toiminguid, muidugi inimestega suhtlevad ja lahendavad väljakutsuvad probleemid"
  • Ettevõte kaalub oma AI assistendi jaoks lisatasude tellimuste pakkumist agentide jaoks, näiteks reservatsioonid või videotootmine

Miks Llama 4 on pöördepunkt AI maastikul

Laama 4 väljaanne on oluline samm Metas strateegias saada generatiivse AI juhtivaks valdkonnaks väga konkurentsitihedas piirkonnas. Ekspertide arhitektuuri, loodusliku multimodaalsuse ja muljetavaldavalt pika kontekstiakna segu kasutuselevõtuga näitab meta, et avatud mudelid saavad sammu pidada suurte tehnoloogiaettevõtete patenteeritud mudelitega.

Vaatamata poleemikale litsentsimise ja küsimusele, kas Llama 4 tuleks tõesti nimetada “avatud lähtekoodiga”, on tehniline areng oluline verstapost. Mudelite võime töödelda nii teksti kui ka pilte avab arendajatele ja ettevõtetele uusi võimalusi.

Silmapaistva laama 4 behemothi ja laiendatud keele- ja agendioskuste plaanidega on selge, et Meta intensiivistab veelgi oma investeeringuid AI -sse. Järgmised kuud näitavad, kuidas need uued mudelid muudavad AI maastikku ja kas, nagu Mark Zuckerberg ennustas, aitavad need tegelikult teha tehisintellekti valdkonnas avatud AI -mudeleid.

Sobib selleks:

 

Teie ülemaailmne turundus- ja äriarenduspartner

☑️ Meie ärikeel on inglise või sakslane

☑️ Uus: kirjavahetus teie riigikeeles!

 

Digitaalne teerajaja - Konrad Wolfenstein

Konrad Wolfenstein

Mul on hea meel, et olete teile ja minu meeskonnale isikliku konsultandina kättesaadav.

Võite minuga ühendust võtta, täites siin kontaktvormi või helistage mulle lihtsalt telefonil +49 89 674 804 (München) . Minu e -posti aadress on: Wolfenstein xpert.digital

Ootan meie ühist projekti.

 

 

☑️ VKE tugi strateegia, nõuannete, planeerimise ja rakendamise alal

☑️ digitaalse strateegia loomine või ümberpaigutamine ja digiteerimine

☑️ Rahvusvaheliste müügiprotsesside laiendamine ja optimeerimine

☑️ Globaalsed ja digitaalsed B2B kauplemisplatvormid

☑️ teerajajate äriarendus / turundus / PR / mõõde


⭐️ tehisintellekt (AI) -Ai ajaveeb, leviala ja sisukeskus ⭐️ Digitaalne intelligentsus ⭐️ XPaper