Webhely ikonra Xpert.Digital

A Meta új Llama 4 Scout, Maverick és Behemoth közzéteszi

A Meta új Llama 4 Scout, Maverick és Behemoth közzéteszi

A Meta bemutatja az új mesterséges intelligencia által vezérelt modellsorozatokat: a Llama 4 Scoutot, a Mavericket és a Behemothot – Kép: Xpert.Digital

Llama 4: A Metától származó nyílt mesterséges intelligencia rendszerek új generációja

Llama 4 leleplezve: Meta kulcsa a mesterséges intelligencia következő korszakához

2025. április 5-én a Meta bemutatta mesterséges intelligencia modelljeinek legújabb generációját, a Llama 4-et. Ezek az új modellek jelentős előrelépést jelentenek a nyílt mesterséges intelligencia rendszerek fejlesztésében, és számos úttörő képességgel rendelkeznek, amelyek jelentősen növelik teljesítményüket és hatékonyságukat. A Llama 4 sorozat több modellt foglal magában, amelyek közül kettő már nyilvánosan elérhető, míg a legerősebb modell még a betanítási fázisban van.

Alkalmas:

A Llama 4 modellcsalád

A Meta három különböző modellt fejlesztett ki a Llama 4 sorozatban, mindegyiket különböző felhasználási esetekre optimalizálva:

Láma 4 Cserkész

A Llama 4 Scout egy kompakt modell lenyűgöző műszaki adatokkal:

  • 17 milliárd aktív paraméter 16 szakértővel (összesen 109 milliárd paraméter)
  • Egyetlen NVIDIA H100 GPU-n működtethető Int4 kvantálással
  • Figyelemre méltóan nagy, 10 millió tokennyi kontextuális ablakkal rendelkezik, így ez az egyik első ilyen kapacitással rendelkező nyílt modell.

A Meta szerint a Scout felülmúlja kategóriájában a többi modellt, például a Gemini 3-at, a Gemini 2.0 Flash-Lite-ot és a Mistral 3.1-et. Különösen alkalmas olyan feladatokra, mint a hosszú dokumentumok összefoglalása, a tartalom személyre szabása felhasználói adatok alapján, valamint összetett következtetések levonása nagy mennyiségű tudásból.

Láma 4 Maverick

A Llama 4 Maverick a két elérhető modell közül az erősebb:

  • 17 milliárd aktív paraméter 128 szakértővel (összesen 400 milliárd paraméter)
  • A kísérleti chat verzió elérte az 1417-es ELO-t az LMArena-n.
  • A Meta szerint számos benchmarkban felülmúlja olyan modelleket, mint a GPT-4o és a Gemini 2.0 Flash.

Ez a modell különösen alkalmas általános segítségnyújtási és csevegési alkalmazásokhoz, például kreatív íráshoz, és a DeepSeek v3-hoz hasonló eredményeket mutat az érvelési és kódolási feladatokban, de a paraméterek felével.

Láma 4 Behemót

A Llama 4 Behemoth a Meta legerősebb modellje, de még nem nyilvánosan elérhető:

  • 288 milliárd aktív paraméter 16 szakértővel (összesen közel 2 billió paraméter)
  • A Meta szerint számos STEM benchmarkban felülmúlja a GPT-4.5-öt, a Claude Sonnet 3.7-et és a Gemini 2.0 Pro-t.
  • „Tanármodellként” szolgál a kisebb Llama 4 modellekhez.

A Behemoth jelenleg még a betanítási fázisban van, és egy későbbi időpontban jelenik meg.

Műszaki újítások

A Llama 4 modellcsalád számos jelentős műszaki újítást vezet be, amelyek javítják a teljesítményét és a hatékonyságát:

Szakértők Vegyes Építészete (MoE)

A Llama 4 egyik legfontosabb újítása a Mixture of Experts (MoE) architektúra, amelyben minden tokenhez csak a modellparaméterek egy részhalmaza aktiválódik:

  • Ez jelentősen csökkenti a számítási erőfeszítést és a késleltetést, miközben megőrzi a magas teljesítményt.
  • A Llama 4 Maverickben minden tokent egy megosztott szakértő és a 128 irányított szakértő egyike dolgoz fel.
  • Ez az architektúra lehetővé teszi a modell általános paramétereinek növelését a következtetési költségek növelése nélkül.

Natív multimodalitás korai fúzióval

A Llama 4 az első nyílt modell, amely natív multimodalitással rendelkezik a korai fúzió révén:

  • A szöveges és képi tokenek egy egységes modellarchitektúrába vannak integrálva.
  • Ez lehetővé teszi a közös előképzést nagy mennyiségű szöveges, képi és videós adattal.
  • A Llama 3.2-vel ellentétben, amely külön paramétereket használt a szöveghez és a képekhez, a Llama 4 natívan megérti mindkét modalitást ugyanazokkal a paraméterekkel.

Rendkívül hosszú kontextuális ablak

A Llama 4 Scout rendkívül hosszú kontextusablaka különösen lenyűgöző:

  • 10 millió tokennel jelentősen felülmúlja a legtöbb elérhető modellt.
  • Ez lehetővé teszi nagyon hosszú dokumentumok, teljes kódbázisok vagy kiterjedt beszélgetések feldolgozását.
  • Az iRoPE architektúra (interleaved attention layers, azaz átlapolt figyelemrétegek) teszi ezt lehetővé.

Új képzési módszerek

A Meta számos innovatív módszert alkalmazott a Láma 4 kiképzésére:

  • MetaP: Kritikus modell hiperparaméterek robusztus hangolására szolgáló technika
  • FP8 pontosság: 8 bites lebegőpontos számok használata a hatékony betanításhoz
  • Együttes lepárlás: A Llama 4 Behemoth használata tanármodellként kisebb modellekhez
  • Teljesen aszinkron online tanulás erősítéssel: Új infrastruktúra a nagyléptékű tanuláshoz

Elérhetőség és integráció

A Llama 4 modellek különböző platformokon és szolgáltatásokon keresztül érhetők el:

Letöltési és felhőszolgáltatók

  • A Scout és Maverick modellek közvetlenül a Metáról vagy a Hugging Face-en keresztül tölthetők le.
  • Különböző felhőplatformokon keresztül is elérhetők:
    • Cloudflare Workers mesterséges intelligencia
    • Azure AI Foundry és Azure Databricks
    • A Google Cloud Vertex mesterséges intelligenciája
    • A következő napokban további partnerek is csatlakoznak.

Integráció metatermékekbe

A Meta már frissítette mesterséges intelligenciával működő asszisztenseit a Llama 4-re különböző platformokon:

  • WhatsApp, Messenger és Instagram Direct 40 különböző országban
  • A Meta.AI weboldala
  • A multimodális funkciók azonban jelenleg csak az angolul beszélő felhasználók számára érhetők el az Egyesült Államokban.

Alkalmas:

Engedélyezés és viták

Bár a Meta Llama 4-et „nyílt forráskódúként” írják le, a licencben vannak bizonyos korlátozások, amelyek vitákat váltottak ki:

Licenckorlátozások

A Llama 4 közösségi licenc számos korlátozást tartalmaz:

  • A havi 700 milliónál több aktív felhasználóval rendelkező vállalatoknak speciális licencre van szükségük a Meta-tól.
  • Az EU-ból érkező felhasználók és vállalatok nyilvánvalóan nem használhatják vagy terjeszthetik a modelleket, feltehetően a szabályozási követelmények miatt.
  • A származtatott modellek elnevezésére és attribúciójára vonatkozóan követelmények vannak.

Vita a „nyílt forráskódú” szoftverekről

Vita folyik arról, hogy a Llama 4-et valóban „nyílt forráskódúnak” kellene-e nevezni:

  • A Nyílt Forráskódú Kezdeményezés 2023-ban megállapította, hogy a Llama licencben foglalt korlátozások „kiveszik a »Nyílt Forráskódú« kategóriából”.
  • A kritikusok azzal érvelnek, hogy inkább egy „forráskód-nyílt” vagy „nyílt súlyú” modell, mintsem valódi nyílt forráskódú szoftver.
  • Az engedélyezési korlátozások problémásak lehetnek a saját jogi osztály nélküli kisvállalkozások számára.

Jövőbeli tervek

Meta már adott néhány betekintést a Llama 4-gyel és az azt követő részekkel kapcsolatos jövőbeli terveibe:

LlamaCon és egyéb bejelentések

  • A Meta 2025. április 29-én rendezi meg első LlamaCon konferenciáját, ahol további részleteket fognak bejelenteni a mesterséges intelligencia modelljeiről és termékterveiről.
  • A vállalat azt is tervezi, hogy a második negyedévben kiad egy dedikált alkalmazást a meta chatbotjához.

Nyelvi készségek bővítése

  • A Meta azon dolgozik, hogy fejlessze Llama 4 nyelvi készségeit, hogy természetesebb beszélgetéseket tudjon folytatni.
  • A cél a gördülékenyebb, kétirányú párbeszédek lehetővé tétele, ahol a felhasználók megszakíthatják a mesterséges intelligencia modelljét.
  • Chris Cox, a Meta termékigazgatója a készülő Llama 4-et egy „omnimodellként” jellemezte, amely lehetővé teszi az anyanyelv használatát a beszéd szöveggé fordítása helyett.

Ügynöki mesterséges intelligencia és továbbfejlesztett képességek

  • Mark Zuckerberg bejelentette, hogy a Llama 4 „ügynöki képességekkel” fog rendelkezni, amelyek új felhasználási eseteket tesznek lehetővé.
  • A Meta célja olyan mesterséges intelligencia modellek fejlesztése, amelyek „általánosított műveleteket hajthatnak végre, természetes módon kommunikálhatnak az emberekkel, és kihívást jelentő problémákat oldhatnak meg”.
  • A vállalat fontolgatja, hogy prémium előfizetéseket kínáljon AI asszisztenséhez ügynökökkel kapcsolatos célokra, például foglalásokra vagy videógyártásra.

Miért fordulópont a Llama 4 a mesterséges intelligencia világában?

A Llama 4 megjelenése jelentős lépés a Meta stratégiájában, hogy vezető szerepet töltsön be a generatív mesterséges intelligencia rendkívül versenyképes területén. A Mixture of Experts architektúra, a natív multimodalitás és a lenyűgözően hosszú kontextusablak bevezetésével a Meta demonstrálja, hogy a nyílt modellek képesek versenyezni a nagy technológiai vállalatok saját modelljeivel.

A licencelés körüli viták és a Llama 4 „nyílt forráskódú” programként való emlegetésével kapcsolatos kérdés ellenére a technikai fejlesztések jelentős mérföldkövet jelentenek. A modellek szöveg- és képfeldolgozási képessége új lehetőségeket nyit meg a fejlesztők és a vállalkozások számára.

Mivel a Llama 4 Behemoth még függőben van, és a továbbfejlesztett nyelvi és ügynöki képességekre vonatkozó tervek is bejelentettek, egyértelmű, hogy a Meta tovább fogja fokozni a mesterséges intelligenciába való befektetéseit. Az elkövetkező hónapok megmutatják, hogyan alakítják át ezek az új modellek a mesterséges intelligencia világát, és hogy valóban – ahogy Mark Zuckerberg megjósolta – segítenek-e a nyílt MI-modelleknek a mesterséges intelligencia vezető erejévé válni.

Alkalmas:

 

Az Ön globális marketing- és üzletfejlesztési partnere

☑️ Üzleti nyelvünk angol vagy német

☑️ ÚJ: Levelezés az Ön nemzeti nyelvén!

 

Konrad Wolfenstein

Szívesen szolgálok Önt és csapatomat személyes tanácsadóként.

Felveheti velem a kapcsolatot az itt található kapcsolatfelvételi űrlap kitöltésével , vagy egyszerűen hívjon a +49 89 89 674 804 (München) . Az e-mail címem: wolfenstein xpert.digital

Nagyon várom a közös projektünket.

 

 

☑️ KKV-k támogatása stratégiában, tanácsadásban, tervezésben és megvalósításban

☑️ Digitális stratégia és digitalizáció megalkotása vagy átrendezése

☑️ Nemzetközi értékesítési folyamatok bővítése, optimalizálása

☑️ Globális és digitális B2B kereskedési platformok

☑️ Úttörő üzletfejlesztés / Marketing / PR / Szakkiállítások

Lépjen ki a mobil verzióból