A Meta bemutatja az új mesterséges intelligencia által fejlesztett modellsorozatokat: a Llama 4 Scoutot, a Mavericket és a Behemothot.

Konrad Wolfenstein

1 évvel ezelőtt

A Meta bemutatja az új mesterséges intelligencia által vezérelt modellsorozatokat: a Llama 4 Scoutot, a Mavericket és a Behemothot – Kép: Xpert.Digital

Llama 4: A Metától származó nyílt mesterséges intelligencia rendszerek új generációja

Llama 4 leleplezve: Meta kulcsa a mesterséges intelligencia következő korszakához

2025. április 5-én a Meta bemutatta mesterséges intelligencia modelljeinek legújabb generációját, a Llama 4-et. Ezek az új modellek jelentős előrelépést jelentenek a nyílt mesterséges intelligencia rendszerek fejlesztésében, és számos úttörő képességgel rendelkeznek, amelyek jelentősen növelik teljesítményüket és hatékonyságukat. A Llama 4 sorozat több modellt foglal magában, amelyek közül kettő már nyilvánosan elérhető, míg a legerősebb modell még a betanítási fázisban van.

Ehhez kapcsolódóan:

MI-modellek egyszerű magyarázata: Ismerd meg a MI, a nyelvi modellek és az érvelés alapjait

A Llama 4 modellcsalád

A Meta három különböző modellt fejlesztett ki a Llama 4 sorozatban, mindegyiket különböző felhasználási esetekre optimalizálva:

Láma 4 Cserkész

A Llama 4 Scout egy kompakt modell lenyűgöző műszaki adatokkal:

17 milliárd aktív paraméter 16 szakértővel (összesen 109 milliárd paraméter)
Egyetlen NVIDIA H100 GPU-n működtethető Int4 kvantálással
Figyelemre méltóan nagy, 10 millió tokennyi kontextuális ablakkal rendelkezik, így ez az egyik első ilyen kapacitással rendelkező nyílt modell

A Meta szerint a Scout felülmúlja kategóriájában a többi modellt, például a Gemini 3-at, a Gemini 2.0 Flash-Lite-ot és a Mistral 3.1-et. Különösen alkalmas olyan feladatokra, mint a hosszú dokumentumok összefoglalása, a tartalom személyre szabása felhasználói adatok alapján, valamint összetett következtetések levonása nagy mennyiségű tudásból.

Láma 4 Maverick

A Llama 4 Maverick a két elérhető modell közül az erősebb:

17 milliárd aktív paraméter 128 szakértővel (összesen 400 milliárd paraméter)
A kísérleti chat verzió elérte az 1417-es ELO-t az LMArena-n
A Meta szerint számos benchmarkban felülmúlja olyan modelleket, mint a GPT-4o és a Gemini 2.0 Flash

Ez a modell különösen alkalmas általános segítségnyújtási és csevegési alkalmazásokhoz, például kreatív íráshoz, és a DeepSeek v3-hoz hasonló eredményeket mutat az érvelési és kódolási feladatokban, de a paraméterek felével.

Láma 4 Behemót

A Llama 4 Behemoth a Meta legerősebb modellje, de még nem nyilvánosan elérhető:

288 milliárd aktív paraméter 16 szakértővel (összesen közel 2 billió paraméter)
A Meta szerint számos STEM benchmarkban felülmúlja a GPT-4.5-öt, a Claude Sonnet 3.7-et és a Gemini 2.0 Pro-t
„Tanármodellként” szolgál a kisebb Llama 4 modellekhez

A Behemoth jelenleg még a betanítási fázisban van, és egy későbbi időpontban jelenik meg.

Műszaki újítások

A Llama 4 modellcsalád számos jelentős műszaki újítást vezet be, amelyek javítják a teljesítményét és a hatékonyságát:

Szakértők Vegyes Építészete (MoE)

A Llama 4 egyik legfontosabb újítása a Mixture of Experts (MoE) architektúra, amelyben minden tokenhez csak a modellparaméterek egy részhalmaza aktiválódik:

Ez jelentősen csökkenti a számítási erőfeszítést és a késleltetést, miközben megőrzi a magas teljesítményt
A Llama 4 Maverickben minden tokent egy megosztott szakértő és a 128 irányított szakértő egyike dolgoz fel
Ez az architektúra lehetővé teszi a modell általános paramétereinek növelését a következtetési költségek növelése nélkül

Natív multimodalitás korai fúzióval

A Llama 4 az első nyílt modell, amely natív multimodalitással rendelkezik a korai fúzió révén:

A szöveges és képi tokenek egy egységes modellarchitektúrába vannak integrálva
Ez lehetővé teszi a közös előképzést nagy mennyiségű szöveges, képi és videós adattal
A Llama 3.2-vel ellentétben, amely külön paramétereket használt a szöveghez és a képekhez, a Llama 4 natívan megérti mindkét modalitást ugyanazokkal a paraméterekkel

Rendkívül hosszú kontextuális ablak

A Llama 4 Scout rendkívül hosszú kontextusablaka különösen lenyűgöző:

10 millió tokennel jelentősen felülmúlja a legtöbb elérhető modellt
Ez lehetővé teszi nagyon hosszú dokumentumok, teljes kódbázisok vagy kiterjedt beszélgetések feldolgozását
Az iRoPE architektúra (interleaved attention layers, azaz átlapolt figyelemrétegek) teszi ezt lehetővé

Új képzési módszerek

A Meta számos innovatív módszert alkalmazott a Láma 4 kiképzésére:

MetaP: Kritikus modell hiperparaméterek robusztus hangolására szolgáló technika
FP8 pontosság: 8 bites lebegőpontos számok használata a hatékony betanításhoz
Együttes lepárlás: A Llama 4 Behemoth használata tanármodellként kisebb modellekhez
Teljesen aszinkron online tanulás erősítéssel: Új infrastruktúra a nagyléptékű tanuláshoz

Elérhetőség és integráció

A Llama 4 modellek különböző platformokon és szolgáltatásokon keresztül érhetők el:

Letöltési és felhőszolgáltatók

A Scout és Maverick modellek közvetlenül a Metáról vagy a Hugging Face-en keresztül tölthetők le
Különböző felhőplatformokon keresztül is elérhetők:
- Cloudflare Workers mesterséges intelligencia
- Azure AI Foundry és Azure Databricks
- A Google Cloud Vertex mesterséges intelligenciája
- A következő napokban további partnerek is csatlakoznak

Integráció metatermékekbe

A Meta már frissítette mesterséges intelligenciával működő asszisztenseit a Llama 4-re különböző platformokon:

WhatsApp, Messenger és Instagram Direct 40 különböző országban
A Meta.AI weboldala
A multimodális funkciók azonban jelenleg csak az angolul beszélő felhasználók számára érhetők el az Egyesült Államokban

Ehhez kapcsolódóan:

A Meta AI megérkezett Németországba! A WhatsApp, az Instagram és a Facebook is megkapja a mesterséges intelligenciát – fontos különbségekkel az amerikai verzióhoz képest

Engedélyezés és viták

Bár a Meta Llama 4-et „nyílt forráskódúként” írják le, a licencben vannak bizonyos korlátozások, amelyek vitákat váltottak ki:

Licenckorlátozások

A Llama 4 közösségi licenc számos korlátozást tartalmaz:

A havi 700 milliónál több aktív felhasználóval rendelkező vállalatoknak speciális licencre van szükségük a Meta-tól
Az EU-ból érkező felhasználók és vállalatok nyilvánvalóan nem használhatják vagy terjeszthetik a modelleket, feltehetően a szabályozási követelmények miatt
A származtatott modellek elnevezésére és attribúciójára vonatkozóan követelmények vannak

Vita a „nyílt forráskódú” szoftverekről

Vita folyik arról, hogy a Llama 4-et valóban „nyílt forráskódúnak” kellene-e nevezni:

A Nyílt Forráskódú Kezdeményezés 2023-ban megállapította, hogy a Llama licencben foglalt korlátozások „kiveszik a »Nyílt Forráskódú« kategóriából”
A kritikusok azzal érvelnek, hogy inkább egy „forráskód-nyílt” vagy „nyílt súlyú” modell, mintsem valódi nyílt forráskódú szoftver
Az engedélyezési korlátozások problémásak lehetnek a saját jogi osztály nélküli kisvállalkozások számára

Jövőbeli tervek

Meta már adott néhány betekintést a Llama 4-gyel és az azt követő részekkel kapcsolatos jövőbeli terveibe:

LlamaCon és egyéb bejelentések

A Meta 2025. április 29-én rendezi meg első LlamaCon konferenciáját, ahol további részleteket fognak bejelenteni a mesterséges intelligencia modelljeiről és termékterveiről
A vállalat azt is tervezi, hogy a második negyedévben kiad egy dedikált alkalmazást a meta chatbotjához

Nyelvi készségek bővítése

A Meta azon dolgozik, hogy fejlessze Llama 4 nyelvi készségeit, hogy természetesebb beszélgetéseket tudjon folytatni
A cél a gördülékenyebb, kétirányú párbeszédek lehetővé tétele, ahol a felhasználók megszakíthatják a mesterséges intelligencia modelljét
Chris Cox, a Meta termékigazgatója a készülő Llama 4-et egy „omnimodellként” jellemezte, amely lehetővé teszi az anyanyelv használatát a beszéd szöveggé fordítása helyett

Ügynöki mesterséges intelligencia és továbbfejlesztett képességek

Mark Zuckerberg bejelentette, hogy a Llama 4 „ügynöki képességekkel” fog rendelkezni, amelyek új felhasználási eseteket tesznek lehetővé
A Meta célja olyan mesterséges intelligencia modellek fejlesztése, amelyek „általánosított műveleteket hajthatnak végre, természetes módon kommunikálhatnak az emberekkel, és kihívást jelentő problémákat oldhatnak meg”
A vállalat fontolgatja, hogy prémium előfizetéseket kínáljon AI asszisztenséhez ügynökökkel kapcsolatos célokra, például foglalásokra vagy videógyártásra

Miért fordulópont a Llama 4 a mesterséges intelligencia világában?

A Llama 4 megjelenése jelentős lépés a Meta stratégiájában, hogy vezető szerepet töltsön be a generatív mesterséges intelligencia rendkívül versenyképes területén. A Mixture of Experts architektúra, a natív multimodalitás és a lenyűgözően hosszú kontextusablak bevezetésével a Meta demonstrálja, hogy a nyílt modellek képesek versenyezni a nagy technológiai vállalatok saját modelljeivel.

A licencelés körüli viták és a Llama 4 „nyílt forráskódú” programként való emlegetésével kapcsolatos kérdés ellenére a technikai fejlesztések jelentős mérföldkövet jelentenek. A modellek szöveg- és képfeldolgozási képessége új lehetőségeket nyit meg a fejlesztők és a vállalkozások számára.

Mivel a Llama 4 Behemoth még függőben van, és a továbbfejlesztett nyelvi és ügynöki képességekre vonatkozó tervek is bejelentettek, egyértelmű, hogy a Meta tovább fogja fokozni a mesterséges intelligenciába való befektetéseit. Az elkövetkező hónapok megmutatják, hogyan alakítják át ezek az új modellek a mesterséges intelligencia világát, és hogy valóban – ahogy Mark Zuckerberg megjósolta – segítenek-e a nyílt MI-modelleknek a mesterséges intelligencia vezető erejévé válni.

Ehhez kapcsolódóan:

Globális marketing- és üzletfejlesztési partnere

☑️ Üzleti nyelvünk az angol vagy a német

☑️ ÚJ: Levelezés az anyanyelveden!

Konrad Wolfenstein

Én és a csapatom örömmel állunk rendelkezésére személyes tanácsadóként.

Kapcsolatba léphetsz velem a kapcsolatfelvételi űrlap kitöltésével itt egyszerűen hívj a +49 7348 4088 965 Az e-mail címem wolfenstein@xpert.digital:, vagy

Alig várom a közös projektünket.

A Meta bemutatja az új mesterséges intelligencia által fejlesztett modellsorozatokat: a Llama 4 Scoutot, a Mavericket és a Behemothot.

Llama 4: A Metától származó nyílt mesterséges intelligencia rendszerek új generációja