
A Meta bemutatja az új mesterséges intelligencia által vezérelt modellsorozatokat: a Llama 4 Scoutot, a Mavericket és a Behemothot – Kép: Xpert.Digital
Llama 4: A Metától származó nyílt mesterséges intelligencia rendszerek új generációja
Llama 4 leleplezve: Meta kulcsa a mesterséges intelligencia következő korszakához
2025. április 5-én a Meta bemutatta mesterséges intelligencia modelljeinek legújabb generációját, a Llama 4-et. Ezek az új modellek jelentős előrelépést jelentenek a nyílt mesterséges intelligencia rendszerek fejlesztésében, és számos úttörő képességgel rendelkeznek, amelyek jelentősen növelik teljesítményüket és hatékonyságukat. A Llama 4 sorozat több modellt foglal magában, amelyek közül kettő már nyilvánosan elérhető, míg a legerősebb modell még a betanítási fázisban van.
Alkalmas:
A Llama 4 modellcsalád
A Meta három különböző modellt fejlesztett ki a Llama 4 sorozatban, mindegyiket különböző felhasználási esetekre optimalizálva:
Láma 4 Cserkész
A Llama 4 Scout egy kompakt modell lenyűgöző műszaki adatokkal:
- 17 milliárd aktív paraméter 16 szakértővel (összesen 109 milliárd paraméter)
- Egyetlen NVIDIA H100 GPU-n működtethető Int4 kvantálással
- Figyelemre méltóan nagy, 10 millió tokennyi kontextuális ablakkal rendelkezik, így ez az egyik első ilyen kapacitással rendelkező nyílt modell.
A Meta szerint a Scout felülmúlja kategóriájában a többi modellt, például a Gemini 3-at, a Gemini 2.0 Flash-Lite-ot és a Mistral 3.1-et. Különösen alkalmas olyan feladatokra, mint a hosszú dokumentumok összefoglalása, a tartalom személyre szabása felhasználói adatok alapján, valamint összetett következtetések levonása nagy mennyiségű tudásból.
Láma 4 Maverick
A Llama 4 Maverick a két elérhető modell közül az erősebb:
- 17 milliárd aktív paraméter 128 szakértővel (összesen 400 milliárd paraméter)
- A kísérleti chat verzió elérte az 1417-es ELO-t az LMArena-n.
- A Meta szerint számos benchmarkban felülmúlja olyan modelleket, mint a GPT-4o és a Gemini 2.0 Flash.
Ez a modell különösen alkalmas általános segítségnyújtási és csevegési alkalmazásokhoz, például kreatív íráshoz, és a DeepSeek v3-hoz hasonló eredményeket mutat az érvelési és kódolási feladatokban, de a paraméterek felével.
Láma 4 Behemót
A Llama 4 Behemoth a Meta legerősebb modellje, de még nem nyilvánosan elérhető:
- 288 milliárd aktív paraméter 16 szakértővel (összesen közel 2 billió paraméter)
- A Meta szerint számos STEM benchmarkban felülmúlja a GPT-4.5-öt, a Claude Sonnet 3.7-et és a Gemini 2.0 Pro-t.
- „Tanármodellként” szolgál a kisebb Llama 4 modellekhez.
A Behemoth jelenleg még a betanítási fázisban van, és egy későbbi időpontban jelenik meg.
Műszaki újítások
A Llama 4 modellcsalád számos jelentős műszaki újítást vezet be, amelyek javítják a teljesítményét és a hatékonyságát:
Szakértők Vegyes Építészete (MoE)
A Llama 4 egyik legfontosabb újítása a Mixture of Experts (MoE) architektúra, amelyben minden tokenhez csak a modellparaméterek egy részhalmaza aktiválódik:
- Ez jelentősen csökkenti a számítási erőfeszítést és a késleltetést, miközben megőrzi a magas teljesítményt.
- A Llama 4 Maverickben minden tokent egy megosztott szakértő és a 128 irányított szakértő egyike dolgoz fel.
- Ez az architektúra lehetővé teszi a modell általános paramétereinek növelését a következtetési költségek növelése nélkül.
Natív multimodalitás korai fúzióval
A Llama 4 az első nyílt modell, amely natív multimodalitással rendelkezik a korai fúzió révén:
- A szöveges és képi tokenek egy egységes modellarchitektúrába vannak integrálva.
- Ez lehetővé teszi a közös előképzést nagy mennyiségű szöveges, képi és videós adattal.
- A Llama 3.2-vel ellentétben, amely külön paramétereket használt a szöveghez és a képekhez, a Llama 4 natívan megérti mindkét modalitást ugyanazokkal a paraméterekkel.
Rendkívül hosszú kontextuális ablak
A Llama 4 Scout rendkívül hosszú kontextusablaka különösen lenyűgöző:
- 10 millió tokennel jelentősen felülmúlja a legtöbb elérhető modellt.
- Ez lehetővé teszi nagyon hosszú dokumentumok, teljes kódbázisok vagy kiterjedt beszélgetések feldolgozását.
- Az iRoPE architektúra (interleaved attention layers, azaz átlapolt figyelemrétegek) teszi ezt lehetővé.
Új képzési módszerek
A Meta számos innovatív módszert alkalmazott a Láma 4 kiképzésére:
- MetaP: Kritikus modell hiperparaméterek robusztus hangolására szolgáló technika
- FP8 pontosság: 8 bites lebegőpontos számok használata a hatékony betanításhoz
- Együttes lepárlás: A Llama 4 Behemoth használata tanármodellként kisebb modellekhez
- Teljesen aszinkron online tanulás erősítéssel: Új infrastruktúra a nagyléptékű tanuláshoz
Elérhetőség és integráció
A Llama 4 modellek különböző platformokon és szolgáltatásokon keresztül érhetők el:
Letöltési és felhőszolgáltatók
- A Scout és Maverick modellek közvetlenül a Metáról vagy a Hugging Face-en keresztül tölthetők le.
- Különböző felhőplatformokon keresztül is elérhetők:
- Cloudflare Workers mesterséges intelligencia
- Azure AI Foundry és Azure Databricks
- A Google Cloud Vertex mesterséges intelligenciája
- A következő napokban további partnerek is csatlakoznak.
Integráció metatermékekbe
A Meta már frissítette mesterséges intelligenciával működő asszisztenseit a Llama 4-re különböző platformokon:
- WhatsApp, Messenger és Instagram Direct 40 különböző országban
- A Meta.AI weboldala
- A multimodális funkciók azonban jelenleg csak az angolul beszélő felhasználók számára érhetők el az Egyesült Államokban.
Alkalmas:
- Meta AI a németországi! A WhatsApp, az Instagram és a Facebook fontos különbségeket kap az amerikai verzióban
Engedélyezés és viták
Bár a Meta Llama 4-et „nyílt forráskódúként” írják le, a licencben vannak bizonyos korlátozások, amelyek vitákat váltottak ki:
Licenckorlátozások
A Llama 4 közösségi licenc számos korlátozást tartalmaz:
- A havi 700 milliónál több aktív felhasználóval rendelkező vállalatoknak speciális licencre van szükségük a Meta-tól.
- Az EU-ból érkező felhasználók és vállalatok nyilvánvalóan nem használhatják vagy terjeszthetik a modelleket, feltehetően a szabályozási követelmények miatt.
- A származtatott modellek elnevezésére és attribúciójára vonatkozóan követelmények vannak.
Vita a „nyílt forráskódú” szoftverekről
Vita folyik arról, hogy a Llama 4-et valóban „nyílt forráskódúnak” kellene-e nevezni:
- A Nyílt Forráskódú Kezdeményezés 2023-ban megállapította, hogy a Llama licencben foglalt korlátozások „kiveszik a »Nyílt Forráskódú« kategóriából”.
- A kritikusok azzal érvelnek, hogy inkább egy „forráskód-nyílt” vagy „nyílt súlyú” modell, mintsem valódi nyílt forráskódú szoftver.
- Az engedélyezési korlátozások problémásak lehetnek a saját jogi osztály nélküli kisvállalkozások számára.
Jövőbeli tervek
Meta már adott néhány betekintést a Llama 4-gyel és az azt követő részekkel kapcsolatos jövőbeli terveibe:
LlamaCon és egyéb bejelentések
- A Meta 2025. április 29-én rendezi meg első LlamaCon konferenciáját, ahol további részleteket fognak bejelenteni a mesterséges intelligencia modelljeiről és termékterveiről.
- A vállalat azt is tervezi, hogy a második negyedévben kiad egy dedikált alkalmazást a meta chatbotjához.
Nyelvi készségek bővítése
- A Meta azon dolgozik, hogy fejlessze Llama 4 nyelvi készségeit, hogy természetesebb beszélgetéseket tudjon folytatni.
- A cél a gördülékenyebb, kétirányú párbeszédek lehetővé tétele, ahol a felhasználók megszakíthatják a mesterséges intelligencia modelljét.
- Chris Cox, a Meta termékigazgatója a készülő Llama 4-et egy „omnimodellként” jellemezte, amely lehetővé teszi az anyanyelv használatát a beszéd szöveggé fordítása helyett.
Ügynöki mesterséges intelligencia és továbbfejlesztett képességek
- Mark Zuckerberg bejelentette, hogy a Llama 4 „ügynöki képességekkel” fog rendelkezni, amelyek új felhasználási eseteket tesznek lehetővé.
- A Meta célja olyan mesterséges intelligencia modellek fejlesztése, amelyek „általánosított műveleteket hajthatnak végre, természetes módon kommunikálhatnak az emberekkel, és kihívást jelentő problémákat oldhatnak meg”.
- A vállalat fontolgatja, hogy prémium előfizetéseket kínáljon AI asszisztenséhez ügynökökkel kapcsolatos célokra, például foglalásokra vagy videógyártásra.
Miért fordulópont a Llama 4 a mesterséges intelligencia világában?
A Llama 4 megjelenése jelentős lépés a Meta stratégiájában, hogy vezető szerepet töltsön be a generatív mesterséges intelligencia rendkívül versenyképes területén. A Mixture of Experts architektúra, a natív multimodalitás és a lenyűgözően hosszú kontextusablak bevezetésével a Meta demonstrálja, hogy a nyílt modellek képesek versenyezni a nagy technológiai vállalatok saját modelljeivel.
A licencelés körüli viták és a Llama 4 „nyílt forráskódú” programként való emlegetésével kapcsolatos kérdés ellenére a technikai fejlesztések jelentős mérföldkövet jelentenek. A modellek szöveg- és képfeldolgozási képessége új lehetőségeket nyit meg a fejlesztők és a vállalkozások számára.
Mivel a Llama 4 Behemoth még függőben van, és a továbbfejlesztett nyelvi és ügynöki képességekre vonatkozó tervek is bejelentettek, egyértelmű, hogy a Meta tovább fogja fokozni a mesterséges intelligenciába való befektetéseit. Az elkövetkező hónapok megmutatják, hogyan alakítják át ezek az új modellek a mesterséges intelligencia világát, és hogy valóban – ahogy Mark Zuckerberg megjósolta – segítenek-e a nyílt MI-modelleknek a mesterséges intelligencia vezető erejévé válni.
Alkalmas:
Az Ön globális marketing- és üzletfejlesztési partnere
☑️ Üzleti nyelvünk angol vagy német
☑️ ÚJ: Levelezés az Ön nemzeti nyelvén!
Szívesen szolgálok Önt és csapatomat személyes tanácsadóként.
Felveheti velem a kapcsolatot az itt található kapcsolatfelvételi űrlap kitöltésével , vagy egyszerűen hívjon a +49 89 89 674 804 (München) . Az e-mail címem: wolfenstein ∂ xpert.digital
Nagyon várom a közös projektünket.

