Avaldatud: 6. aprillil 2025 / Uuendatud: 6. aprillil 2025 – Autor: Konrad Wolfenstein

Meta avaldab uued tehisintellektiga mudeliseeriad Llama 4 Scout, Maverick ja Behemoth – Pilt: Xpert.Digital
Llama 4: Meta uue põlvkonna avatud tehisintellekti süsteemid
Llama 4 paljastatud: Meta võti tehisintellekti järgmisse ajastusse
5. aprillil 2025 avalikustas Meta oma tehisintellekti mudelite uusima põlvkonna, Llama 4. Need uued mudelid kujutavad endast olulist edasiminekut avatud tehisintellekti süsteemide arendamisel ning pakuvad mitmeid murrangulisi võimalusi, mis parandavad oluliselt nende jõudlust ja tõhusust. Llama 4 seeria koosneb mitmest mudelist, millest kaks on juba avalikult saadaval, samas kui võimsaim mudel on alles koolitusfaasis.
Sobib selleks:
- Tehisintellekti mudelid lihtsalt lahti seletatuna: mõistke tehisintellekti, keelemudelite ja arutluskäigu põhitõdesid
Llama 4 mudeliperekond
Meta on Llama 4 seerias välja töötanud kolm erinevat mudelit, millest igaüks on optimeeritud erinevate kasutusjuhtude jaoks:
Laama 4 skaut
Llama 4 Scout on kompaktne mudel muljetavaldavate tehniliste näitajatega:
- 17 miljardit aktiivset parameetrit 16 eksperdiga (kokku 109 miljardit parameetrit)
- Saab töötada ühel NVIDIA H100 GPU-l Int4 kvantiseerimisega
- Sellel on märkimisväärselt suur kontekstiaken, mis sisaldab 10 miljonit žetooni, mis teeb sellest ühe esimese sellise mahutavusega avatud mudeli.
Meta andmetel edestab Scout oma klassi teisi mudeleid, näiteks Gemini 3, Gemini 2.0 Flash-Lite ja Mistral 3.1. See sobib eriti hästi selliste ülesannete jaoks nagu pikkade dokumentide kokkuvõtete tegemine, sisu isikupärastamine kasutajaandmete põhjal ja keerukate järelduste tegemine suurest teadmushulgast.
Laama 4 Maverick
Llama 4 Maverick on kahest saadaolevast mudelist võimsam:
- 17 miljardit aktiivset parameetrit 128 eksperdiga (kokku 400 miljardit parameetrit)
- Eksperimentaalne vestlusversioon jõudis LMArena platvormil ELO 1417-ni.
- Meta andmetel edestab see arvukates võrdlustestides selliseid mudeleid nagu GPT-4o ja Gemini 2.0 Flash.
See mudel sobib eriti hästi üldise abi ja vestlusrakenduste, näiteks loomingulise kirjutamise jaoks ning näitab arutlus- ja kodeerimisülesannetes DeepSeek v3-ga võrreldavaid tulemusi, kuid poole väiksemate parameetritega.
Laama 4 Behemoth
Llama 4 Behemoth on Meta võimsaim mudel, kuid see pole veel avalikult saadaval:
- 288 miljardit aktiivset parameetrit 16 eksperdiga (kokku ligi 2 triljonit parameetrit)
- Meta andmetel edestab see mitmetes STEM-i võrdlusalustes GPT-4.5, Claude Sonnet 3.7 ja Gemini 2.0 Pro.
- Toimib väiksemate Llama 4 mudelite „õpetajamudelina“.
Behemoth on praegu veel treeningfaasis ja avaldatakse hiljem.
Tehnilised uuendused
Llama 4 mudelivalikus on mitmeid olulisi tehnilisi uuendusi, mis parandavad selle jõudlust ja tõhusust:
Ekspertide segu (MoE) arhitektuur
Üks olulisemaid uuendusi Llama 4-s on ekspertide segu (MoE) arhitektuur, milles iga märgi jaoks aktiveeritakse ainult alamhulk mudeli parameetritest:
- See vähendab oluliselt arvutuslikku pingutust ja latentsust, säilitades samal ajal kõrge jõudluse.
- Mängus Llama 4 Maverick töötleb iga žetooni jagatud ekspert ja üks 128 marsruuditud eksperdist.
- See arhitektuur võimaldab suurendada mudeli üldparameetreid ilma järelduskulusid suurendamata.
Natiivne multimodaalsus varajase fusiooniga
Llama 4 on esimene avatud mudel, millel on varajase fusiooni kaudu natiivne multimodaalsus:
- Teksti- ja pilditokenid on integreeritud ühtseks mudeliarhitektuuriks.
- See võimaldab ühist eelkoolitust suure hulga teksti-, pildi- ja videoandmetega.
- Erinevalt Llama 3.2-st, mis kasutas teksti ja piltide jaoks eraldi parameetreid, saab Llama 4 mõlemast modaalsusest aru natiivselt samade parameetritega.
Äärmiselt pikk kontekstiaken
Eriti muljetavaldav on Llama 4 Scouti äärmiselt pikk kontekstiaken:
- 10 miljoni žetooniga ületab see oluliselt enamikku saadaolevaid mudeleid.
- See võimaldab töödelda väga pikki dokumente, terveid koodibaase või ulatuslikke vestlusi.
- iRoPE arhitektuur (põimunud tähelepanukihid) teeb selle võimalikuks.
Uued treeningmeetodid
Meta on kasutanud Llama 4 treenimiseks mitmeid uuenduslikke meetodeid:
- MetaP: tehnika kriitiliste mudeli hüperparameetrite robustseks häälestamiseks
- FP8 täpsus: 8-bitiste ujukomaarvude kasutamine tõhusaks treenimiseks
- Kaasdestilleerimine: Llama 4 Behemothi kasutamine õpetajamudelina väiksemate mudelite jaoks
- Täielikult asünkroonne veebipõhine õpe võimendusega: uus infrastruktuur laiaulatuslikuks õppeks
Saadavus ja integreerimine
Llama 4 mudelid on saadaval erinevate platvormide ja teenuste kaudu:
Allalaadimis- ja pilveteenuse pakkujad
- Scouti ja Mavericki mudeleid saab alla laadida otse Metast või Hugging Face'i kaudu.
- Need on saadaval ka erinevate pilveplatvormide kaudu:
- Cloudflare'i töötajate tehisintellekt
- Azure AI Foundry ja Azure Databricks
- Google Cloudi Vertex AI
- Lähipäevil lisandub veel partnereid.
Integreerimine metatoodetesse
Meta on oma tehisintellekti assistendid juba erinevatel platvormidel Llama 4-le uuendanud:
- WhatsApp, Messenger ja Instagram Direct 40 erinevas riigis
- Meta.AI veebisait
- Multimodaalsed funktsioonid on praegu aga saadaval ainult inglise keelt kõnelevatele kasutajatele USA-s.
Sobib selleks:
Litsentsimine ja vaidlused
Kuigi Meta Llama 4-d kirjeldatakse kui „avatud lähtekoodiga” tarkvara, on litsentsis mõned piirangud, mis on tekitanud poleemikat:
Litsentsipiirangud
Llama 4 kogukonnalitsents sisaldab mitmeid piiranguid:
- Ettevõtted, millel on üle 700 miljoni igakuise aktiivse kasutaja, vajavad Meta erilitsentsi.
- Ilmselt ei ole EL-i kasutajatel ja ettevõtetel lubatud mudeleid kasutada ega levitada, arvatavasti regulatiivsete nõuete tõttu.
- Tuletatud mudelite nimetamise ja omistamise osas on nõuded.
Arutelu avatud lähtekoodi üle
On vaieldud selle üle, kas Llama 4-t peaks tegelikult nimetama "avatud lähtekoodiga":
- Avatud lähtekoodi algatus otsustas 2023. aastal, et Llama litsentsi piirangud viivad selle „avatud lähtekoodi kategooriast välja“.
- Kriitikud väidavad, et see on pigem „lähtekoodiga avatud” või „avatud kaalu” mudel kui tõeline avatud lähtekoodiga tarkvara.
- Litsentsimispiirangud võivad olla problemaatilised väikeettevõtetele, kellel pole oma juriidilist osakonda.
Tulevikuplaanid
Meta on juba andnud mõningast teavet oma tulevikuplaanide kohta seoses Llama 4 ja edaspidistega:
LlamaCon ja muud teadaanded
- Meta korraldab oma esimese LlamaConi konverentsi 29. aprillil 2025, kus avalikustatakse lisateavet ettevõtte tehisintellekti mudelite ja tooteplaanide kohta.
- Samuti plaanib ettevõte teises kvartalis avaldada spetsiaalse rakenduse oma meta-vestlusroboti jaoks.
Keeleoskuse laiendamine
- Meta töötab selle nimel, et parandada Llama 4 keeleoskust, et võimaldada loomulikumaid vestlusi.
- Eesmärk on võimaldada sujuvamaid kahesuunalisi dialooge, kus kasutajad saavad tehisintellekti mudelit katkestada.
- Meta tootejuht Chris Cox kirjeldas tulevast Llama 4-t kui „omni-mudelit“, mis võimaldab emakeelt kõne tekstiks tõlkimise asemel.
Agentne tehisintellekt ja täiustatud võimalused
- Mark Zuckerberg on teatanud, et Llama 4-l on "agentlikud võimed", mis võimaldavad uusi kasutusjuhtumeid.
- Meta eesmärk on arendada tehisintellekti mudeleid, mis suudavad „teha üldistatud toiminguid, suhelda inimestega loomulikult ja lahendada keerulisi probleeme”.
- Ettevõte kaalub oma tehisintellektiga assistendi premium-tellimuste pakkumist agendiga seotud eesmärkidel, näiteks broneeringute või videote tootmiseks.
Miks on Llama 4 pöördepunkt tehisintellekti maastikul
Llama 4 väljaandmine on oluline samm Meta strateegias, mille eesmärk on saada generatiivse tehisintellekti konkurentsitihedas valdkonnas liidriks. Ekspertide segu arhitektuuri, natiivse multimodaalsuse ja muljetavaldavalt pika kontekstiakna kasutuselevõtuga näitab Meta, et avatud mudelid suudavad konkureerida suurte tehnoloogiaettevõtete patenteeritud mudelitega.
Vaatamata litsentsimisega seotud vaidlustele ja küsimusele, kas Llama 4-t peaks tõesti nimetama "avatud lähtekoodiga" tarkvaraks, kujutavad tehnilised edusammud endast olulist verstaposti. Mudelite võime töödelda nii teksti kui ka pilte avab arendajatele ja ettevõtetele uusi võimalusi.
Kuna Llama 4 Behemoth on veel väljatöötamisel ja keele- ja agentide täiustatud võimekuste plaanid on avalikustatud, on selge, et Meta suurendab oma investeeringuid tehisintellekti veelgi. Lähikuud näitavad, kuidas need uued mudelid muudavad tehisintellekti maastikku ja kas need aitavad avatud tehisintellekti mudelitel tõepoolest, nagu Mark Zuckerberg ennustas, saada tehisintellekti juhtivaks jõuks.
Sobib selleks:
Teie ülemaailmne turundus- ja äriarenduspartner
☑️ Meie ärikeel on inglise või sakslane
☑️ Uus: kirjavahetus teie riigikeeles!
Mul on hea meel, et olete teile ja minu meeskonnale isikliku konsultandina kättesaadav.
Võite minuga ühendust võtta, täites siin kontaktvormi või helistage mulle lihtsalt telefonil +49 89 674 804 (München) . Minu e -posti aadress on: Wolfenstein ∂ xpert.digital
Ootan meie ühist projekti.













