Megjelent: 2025. április 6. / Frissítés: 2025. április 6. - Szerző: Konrad Wolfenstein
Láma 4: A nyitott AI rendszerek új generációja a Meta -tól
A láma 4 kiderült: Metas kulcs a következő AI -korhoz
A Meta 2025. április 5 -én mutatta be AI modelljeinek, a Llama 4 legújabb generációját. Ezek az új modellek jelentős előrelépést jelentenek a nyílt AI rendszerek fejlesztésében, és számos úttörő funkcióval rendelkeznek, amelyek jelentősen növelik teljesítményüket és hatékonyságukat. A Llama 4 sorozat különböző modellekből áll, amelyek közül kettő már nyilvánosan elérhető, míg a legerősebb modell még mindig az edzési szakaszban van.
Alkalmas:
A láma 4 modell család
A Meta három különböző modellt fejlesztett ki a Llama 4 sorozatban, amelyek mindegyikét különböző alkalmazásokhoz optimalizálták:
Láma 4 cserkész
A Llama 4 Scout egy kompakt modell, lenyűgöző műszaki előírásokkal:
- 17 milliárd aktív paraméter 16 szakértővel (összesen 109 milliárd paraméter)
- Üzemeltethető egyetlen NVIDIA H100 GPU -n, INT4 kvantálással
- Rendkívül nagy kontextusú ablaka van, 10 millió token, ami az egyik első nyitott modellt teszi ezzel a kapacitással
A Meta szerint a Scout meghaladja az osztály többi modelljét, például a Gemini 3, a Gemini 2.0 Flash-Lite és a Mistral 3.1. Különösen alkalmas olyan feladatokra, mint például a hosszú dokumentumok összefoglalása, a felhasználói adatokon alapuló személyre szabás és a nagy mennyiségű tudásról szóló összetett következtetések.
Láma 4 Maverick
A Llama 4 Maverick a két elérhető modell közül a hatalmasabb:
- 17 milliárd aktív paraméter 128 szakértővel (összesen 400 milliárd paraméter)
- A kísérleti csevegési verzió elérte az Elo 1417 -et az Lmarena -n
- Meghaladja a modelleket, mint például a GPT-4O és a Gemini 2.0 Flash számos referenciaértékben
Ez a modell különösen alkalmas általános segítségnyújtáshoz és csevegési alkalmazásokhoz, például a kreatív íráshoz, és olyan eredményeket mutat, amelyek összehasonlíthatók a DeepSeek V3 -hoz az érvelési és kódolási feladatokban, de a paraméterek felével.
Láma 4 behemoth
A Llama 4 Behemoth a Metas legerősebb modellje, amely még nem áll rendelkezésre nyilvánosan:
- 288 milliárd aktív paraméter 16 szakértővel (összesen csaknem 2 trillió paraméter)
- A Meta szerint ez meghaladja a GPT-4,5, a Claude Sonnet 3.7 és a Gemini 2.0 Pro több STEM referenciaértéket.
- „Tanári modellként” szolgál a kisebb láma 4 modellek számára
Behemoth jelenleg még mindig az edzési szakaszban van, és később közzéteszik.
Műszaki innovációk
A Llama 4 modell sorozat számos fontos műszaki innovációt vezet be, amelyek javítják teljesítményüket és hatékonyságukat:
Szakértői (MOE) építészet keveréke
A Llama 4 egyik legfontosabb innovációja a szakértői (MOE) építészet keveréke, amelyben a modellparamétereknek csak egy része aktiválódik minden tokenhez:
- Ez jelentősen csökkenti a számítási erőfeszítéseket és a késleltetést, miközben a nagy teljesítményt megőrzik
- A Llama 4 Mavericknél mindegyik tokent egy közös szakértő és a 128 -as zaklatott szakértő egyike dolgozza fel
- Ez az architektúra lehetővé teszi a modell teljes paraméterének növelését anélkül, hogy növelné a következtetési költségeket
Natív multimodalitás a korai fúzióval
A Llama 4 az első nyitott modell, amelynek korai fúziója natív multimodalitással rendelkezik:
- A szöveges és a kép tokenek integrálódnak az egységes modell architektúrába
- Ez lehetővé teszi a közös előzetes képzést nagy mennyiségű szöveg-, kép- és videoadat -adatokkal
- A Llama 3.2 -rel ellentétben, amely külön paramétereket használt a szöveghez és a képekhez, a Llama 4 megérti mindkét natív modalitást, azonos paraméterekkel
Rendkívül hosszú kontextus ablak
A Llama 4 Scout rendkívül hosszú kontextusú ablaka különösen lenyűgöző:
- 10 millió tokennel egyértelműen meghaladja a rendelkezésre álló modelleket
- Ez lehetővé teszi a nagyon hosszú dokumentumok, a teljes kódbázisok vagy a kiterjedt beszélgetések feldolgozását
- Az Irope architektúrája (átlapolt figyelemrétegek) ezt lehetővé teszik
Új képzési módszerek
A Meta számos innovatív módszert alkalmazott a Llama 4 képzéséhez:
- Metap: A kritikus modell hiperaméter robusztus koordinációjának technikája
- FP8 Precision: 8 bites csúszásszámok használata a hatékony edzéshez
- Distilláció: A láma 4 behemoth használata tanári modellként kisebb modellekhez
- Teljesen aszinkron online tanulás megerősítésekkel: Új infrastruktúra a nagyszabású tanuláshoz
Elérhetőség és integráció
A LLAMA 4 modellek különböző platformokon és szolgáltatásokon keresztül érhetők el:
Letöltés és felhő szolgáltató
- A Scout és a Maverick modelleket közvetlenül a meta -ról vagy az ölelés útján lehet letölteni
- Különböző felhőplatformokon keresztül is elérhetők:
- Cloudflare munkások AI
- Azure AI Foundry és Azure Databricks
- A Google Cloud's Vertex AI
- Más partnerek az elkövetkező napokban követik
Integráció a meta termékekbe
A META már frissítette AI asszisztenseit a LLAMA 4 különféle platformjain:
- A WhatsApp, a Messenger és az Instagram Direct 40 különböző országban
- A Meta.AI weboldala
- A multimodális funkciók azonban jelenleg csak az angol nyelvű felhasználók számára érhetők el az USA -ban
Alkalmas:
- Meta AI a németországi! A WhatsApp, az Instagram és a Facebook fontos különbségeket kap az amerikai verzióban
Engedély és vita
Noha a Meta llama 4 a „nyílt forráskódú” -ra utal, a licencben vannak korlátozások, amelyek vitát váltottak ki:
Licenc korlátozások
A LLAMA 4 közösségi engedély számos korlátozást tartalmaz:
- A több mint 700 millió havi aktív felhasználóval rendelkező vállalatoknak speciális licencre van szükségük a Meta -tól
- A modellek nyilvánvalóan nem engedhetik meg, hogy az EU -tól használják vagy terjesszék a felhasználókat és a vállalatokat, feltehetően a szabályozási követelmények miatt
- Vannak követelmények a származtatott modellek elnevezésére és hozzárendelésére
Vita a „nyílt forráskódról”
Vita folyik arról, hogy a Llama 4 -et valóban „nyílt forráskódúnak” kell -e nevezni:
- A nyílt forráskódú kezdeményezés 2023 -ban azt találta, hogy a Llama licenc korlátozásai a „nyílt forráskódú” kategóriából származnak
- A kritikusok azt állítják, hogy ez inkább egy „forrás-nyitott” vagy „nyitott súlyú” modell, mint a valódi nyílt forráskódú szoftver
- A licenckorlátozások problémás lehetnek a kisvállalatok számára, nincs saját jogi osztályuk nélkül
Jövőbeli tervek
A Meta már betekintést adott a Llama 4 és azon túl jövőbeli terveibe:
Llamacon és egyéb bejelentések
- A Meta 2025. április 29 -én rendezi az első Llamacon konferenciát, amelyben az AI modellekről és terméktervekről további részleteket kell bejelenteni
- A társaság azt is tervezi, hogy a második negyedévben külön kérelmet tesz közzé a Meta-Chat bot számára
A nyelvi készségek bővítése
- A Meta a Llama 4 nyelvtudásának fejlesztésén dolgozik, hogy lehetővé tegye a természetes beszélgetéseket
- A cél az, hogy lehetővé tegye a folyékony, kétoldalú párbeszédeket, amelyekben a felhasználók megszakíthatják az AI modellt
- Chris Cox, a Meta terméktisztviselője a közelgő Llama 4 -et „Omni modellnek” írta le, amely lehetővé teszi az anyanyelvt, ahelyett, hogy a nyelvet szövegbe fordítaná, ahelyett
Agentic AI és kibővített készségek
- Mark Zuckerberg bejelentette, hogy a Llama 4 -nek „ügynöki képességei” lesznek, amelyek lehetővé teszik az új alkalmazásokat
- A Meta célja az AI modellek kidolgozása, amelyek „általánosított cselekedeteket hajtanak végre, természetesen kommunikálnak az emberekkel és megoldják a kihívásokkal teli problémákat”
- A társaság fontolóra veszi a prémium előfizetések ajánlását AI -asszisztensnek ügynöki célokra, például foglalások vagy videofelvételek
Miért fordulópont a Llama 4 fordulópont az AI tájban
A Llama 4 közzététele jelentős lépést jelent a metas stratégiájában, hogy a generatív AI vezető területévé váljon a rendkívül versenyképes területen. A szakértői architektúra, a natív multimodalitás és a lenyűgözően hosszú kontextusú ablakok bevezetésével a Meta azt mutatja, hogy a nyitott modellek lépést tudnak tartani a nagy technológiai vállalatok védett modelljeivel.
Annak ellenére, hogy az engedélyezéssel és az a kérdés, hogy a Llama 4 -et valóban „nyílt forrású” -nak nevezzük, a műszaki fejlődés fontos mérföldkő. A modellek képessége mind a szöveg, mind a képek feldolgozására új lehetőségeket kínál a fejlesztők és a vállalatok számára.
A kiemelkedő Llama 4 Behemoth és a kibővített nyelvi és ügynöki készségek bejelentett terveivel egyértelmű, hogy a Meta tovább fokozza az AI -be történő befektetéseit. Az elkövetkező hónapok megmutatják, hogy ezek az új modellek hogyan változtatják meg az AI tájat, és hogy - amint azt Mark Zuckerberg megjósolta, valóban segítenek -e a nyitott AI modellek elkészítésében a mesterséges intelligencia területén.
Alkalmas:
Az Ön globális marketing- és üzletfejlesztési partnere
☑️ Üzleti nyelvünk angol vagy német
☑️ ÚJ: Levelezés az Ön nemzeti nyelvén!
Szívesen szolgálok Önt és csapatomat személyes tanácsadóként.
Felveheti velem a kapcsolatot az itt található kapcsolatfelvételi űrlap kitöltésével , vagy egyszerűen hívjon a +49 89 89 674 804 (München) . Az e-mail címem: wolfenstein ∂ xpert.digital
Nagyon várom a közös projektünket.