⭐️ Mesterséges intelligencia (AI) -i blog, hotspot és tartalmi hub ⭐️ Digitális intelligencia ⭐️ Xpaper

Hangválasztás 📢

A Meta új Llama 4 Scout, Maverick és Behemoth közzéteszi

Megjelent: 2025. április 6. / Frissítés: 2025. április 6. - Szerző: Konrad Wolfenstein

A Meta új Llama 4 Scout, Maverick és Behemoth-Image: xpert.digital közzéteszi

Láma 4: A nyitott AI rendszerek új generációja a Meta -tól

A láma 4 kiderült: Metas kulcs a következő AI -korhoz

A Meta 2025. április 5 -én mutatta be AI modelljeinek, a Llama 4 legújabb generációját. Ezek az új modellek jelentős előrelépést jelentenek a nyílt AI rendszerek fejlesztésében, és számos úttörő funkcióval rendelkeznek, amelyek jelentősen növelik teljesítményüket és hatékonyságukat. A Llama 4 sorozat különböző modellekből áll, amelyek közül kettő már nyilvánosan elérhető, míg a legerősebb modell még mindig az edzési szakaszban van.

Alkalmas:

Egyszerűen magyarázza az AI modelleket: értse meg az AI alapjait, a hangmodelleket és az érvelést

A láma 4 modell család

A Meta három különböző modellt fejlesztett ki a Llama 4 sorozatban, amelyek mindegyikét különböző alkalmazásokhoz optimalizálták:

Láma 4 cserkész

A Llama 4 Scout egy kompakt modell, lenyűgöző műszaki előírásokkal:

17 milliárd aktív paraméter 16 szakértővel (összesen 109 milliárd paraméter)
Üzemeltethető egyetlen NVIDIA H100 GPU -n, INT4 kvantálással
Rendkívül nagy kontextusú ablaka van, 10 millió token, ami az egyik első nyitott modellt teszi ezzel a kapacitással

A Meta szerint a Scout meghaladja az osztály többi modelljét, például a Gemini 3, a Gemini 2.0 Flash-Lite és a Mistral 3.1. Különösen alkalmas olyan feladatokra, mint például a hosszú dokumentumok összefoglalása, a felhasználói adatokon alapuló személyre szabás és a nagy mennyiségű tudásról szóló összetett következtetések.

Láma 4 Maverick

A Llama 4 Maverick a két elérhető modell közül a hatalmasabb:

17 milliárd aktív paraméter 128 szakértővel (összesen 400 milliárd paraméter)
A kísérleti csevegési verzió elérte az Elo 1417 -et az Lmarena -n
Meghaladja a modelleket, mint például a GPT-4O és a Gemini 2.0 Flash számos referenciaértékben

Ez a modell különösen alkalmas általános segítségnyújtáshoz és csevegési alkalmazásokhoz, például a kreatív íráshoz, és olyan eredményeket mutat, amelyek összehasonlíthatók a DeepSeek V3 -hoz az érvelési és kódolási feladatokban, de a paraméterek felével.

Láma 4 behemoth

A Llama 4 Behemoth a Metas legerősebb modellje, amely még nem áll rendelkezésre nyilvánosan:

288 milliárd aktív paraméter 16 szakértővel (összesen csaknem 2 trillió paraméter)
A Meta szerint ez meghaladja a GPT-4,5, a Claude Sonnet 3.7 és a Gemini 2.0 Pro több STEM referenciaértéket.
„Tanári modellként” szolgál a kisebb láma 4 modellek számára

Behemoth jelenleg még mindig az edzési szakaszban van, és később közzéteszik.

Műszaki innovációk

A Llama 4 modell sorozat számos fontos műszaki innovációt vezet be, amelyek javítják teljesítményüket és hatékonyságukat:

Szakértői (MOE) építészet keveréke

A Llama 4 egyik legfontosabb innovációja a szakértői (MOE) építészet keveréke, amelyben a modellparamétereknek csak egy része aktiválódik minden tokenhez:

Ez jelentősen csökkenti a számítási erőfeszítéseket és a késleltetést, miközben a nagy teljesítményt megőrzik
A Llama 4 Mavericknél mindegyik tokent egy közös szakértő és a 128 -as zaklatott szakértő egyike dolgozza fel
Ez az architektúra lehetővé teszi a modell teljes paraméterének növelését anélkül, hogy növelné a következtetési költségeket

Natív multimodalitás a korai fúzióval

A Llama 4 az első nyitott modell, amelynek korai fúziója natív multimodalitással rendelkezik:

A szöveges és a kép tokenek integrálódnak az egységes modell architektúrába
Ez lehetővé teszi a közös előzetes képzést nagy mennyiségű szöveg-, kép- és videoadat -adatokkal
A Llama 3.2 -rel ellentétben, amely külön paramétereket használt a szöveghez és a képekhez, a Llama 4 megérti mindkét natív modalitást, azonos paraméterekkel

Rendkívül hosszú kontextus ablak

A Llama 4 Scout rendkívül hosszú kontextusú ablaka különösen lenyűgöző:

10 millió tokennel egyértelműen meghaladja a rendelkezésre álló modelleket
Ez lehetővé teszi a nagyon hosszú dokumentumok, a teljes kódbázisok vagy a kiterjedt beszélgetések feldolgozását
Az Irope architektúrája (átlapolt figyelemrétegek) ezt lehetővé teszik

Új képzési módszerek

A Meta számos innovatív módszert alkalmazott a Llama 4 képzéséhez:

Metap: A kritikus modell hiperaméter robusztus koordinációjának technikája
FP8 Precision: 8 bites csúszásszámok használata a hatékony edzéshez
Distilláció: A láma 4 behemoth használata tanári modellként kisebb modellekhez
Teljesen aszinkron online tanulás megerősítésekkel: Új infrastruktúra a nagyszabású tanuláshoz

Elérhetőség és integráció

A LLAMA 4 modellek különböző platformokon és szolgáltatásokon keresztül érhetők el:

Letöltés és felhő szolgáltató

A Scout és a Maverick modelleket közvetlenül a meta -ról vagy az ölelés útján lehet letölteni
Különböző felhőplatformokon keresztül is elérhetők:
- Cloudflare munkások AI
- Azure AI Foundry és Azure Databricks
- A Google Cloud's Vertex AI
- Más partnerek az elkövetkező napokban követik

Integráció a meta termékekbe

A META már frissítette AI asszisztenseit a LLAMA 4 különféle platformjain:

A WhatsApp, a Messenger és az Instagram Direct 40 különböző országban
A Meta.AI weboldala
A multimodális funkciók azonban jelenleg csak az angol nyelvű felhasználók számára érhetők el az USA -ban

Alkalmas:

Meta AI a németországi! A WhatsApp, az Instagram és a Facebook fontos különbségeket kap az amerikai verzióban

Engedély és vita

Noha a Meta llama 4 a „nyílt forráskódú” -ra utal, a licencben vannak korlátozások, amelyek vitát váltottak ki:

Licenc korlátozások

A LLAMA 4 közösségi engedély számos korlátozást tartalmaz:

A több mint 700 millió havi aktív felhasználóval rendelkező vállalatoknak speciális licencre van szükségük a Meta -tól
A modellek nyilvánvalóan nem engedhetik meg, hogy az EU -tól használják vagy terjesszék a felhasználókat és a vállalatokat, feltehetően a szabályozási követelmények miatt
Vannak követelmények a származtatott modellek elnevezésére és hozzárendelésére

Vita a „nyílt forráskódról”

Vita folyik arról, hogy a Llama 4 -et valóban „nyílt forráskódúnak” kell -e nevezni:

A nyílt forráskódú kezdeményezés 2023 -ban azt találta, hogy a Llama licenc korlátozásai a „nyílt forráskódú” kategóriából származnak
A kritikusok azt állítják, hogy ez inkább egy „forrás-nyitott” vagy „nyitott súlyú” modell, mint a valódi nyílt forráskódú szoftver
A licenckorlátozások problémás lehetnek a kisvállalatok számára, nincs saját jogi osztályuk nélkül

Jövőbeli tervek

A Meta már betekintést adott a Llama 4 és azon túl jövőbeli terveibe:

Llamacon és egyéb bejelentések

A Meta 2025. április 29 -én rendezi az első Llamacon konferenciát, amelyben az AI modellekről és terméktervekről további részleteket kell bejelenteni
A társaság azt is tervezi, hogy a második negyedévben külön kérelmet tesz közzé a Meta-Chat bot számára

A nyelvi készségek bővítése

A Meta a Llama 4 nyelvtudásának fejlesztésén dolgozik, hogy lehetővé tegye a természetes beszélgetéseket
A cél az, hogy lehetővé tegye a folyékony, kétoldalú párbeszédeket, amelyekben a felhasználók megszakíthatják az AI modellt
Chris Cox, a Meta terméktisztviselője a közelgő Llama 4 -et „Omni modellnek” írta le, amely lehetővé teszi az anyanyelvt, ahelyett, hogy a nyelvet szövegbe fordítaná, ahelyett

Agentic AI és kibővített készségek

Mark Zuckerberg bejelentette, hogy a Llama 4 -nek „ügynöki képességei” lesznek, amelyek lehetővé teszik az új alkalmazásokat
A Meta célja az AI modellek kidolgozása, amelyek „általánosított cselekedeteket hajtanak végre, természetesen kommunikálnak az emberekkel és megoldják a kihívásokkal teli problémákat”
A társaság fontolóra veszi a prémium előfizetések ajánlását AI -asszisztensnek ügynöki célokra, például foglalások vagy videofelvételek

Miért fordulópont a Llama 4 fordulópont az AI tájban

A Llama 4 közzététele jelentős lépést jelent a metas stratégiájában, hogy a generatív AI vezető területévé váljon a rendkívül versenyképes területen. A szakértői architektúra, a natív multimodalitás és a lenyűgözően hosszú kontextusú ablakok bevezetésével a Meta azt mutatja, hogy a nyitott modellek lépést tudnak tartani a nagy technológiai vállalatok védett modelljeivel.

Annak ellenére, hogy az engedélyezéssel és az a kérdés, hogy a Llama 4 -et valóban „nyílt forrású” -nak nevezzük, a műszaki fejlődés fontos mérföldkő. A modellek képessége mind a szöveg, mind a képek feldolgozására új lehetőségeket kínál a fejlesztők és a vállalatok számára.

A kiemelkedő Llama 4 Behemoth és a kibővített nyelvi és ügynöki készségek bejelentett terveivel egyértelmű, hogy a Meta tovább fokozza az AI -be történő befektetéseit. Az elkövetkező hónapok megmutatják, hogy ezek az új modellek hogyan változtatják meg az AI tájat, és hogy - amint azt Mark Zuckerberg megjósolta, valóban segítenek -e a nyitott AI modellek elkészítésében a mesterséges intelligencia területén.

Alkalmas: