Hangválasztás 📢


A Meta új Llama 4 Scout, Maverick és Behemoth közzéteszi

Megjelent: 2025. április 6. / Frissítés: 2025. április 6. - Szerző: Konrad Wolfenstein

A Meta új Llama 4 Scout, Maverick és Behemoth közzéteszi

A Meta új Llama 4 Scout, Maverick és Behemoth-Image: xpert.digital közzéteszi

Láma 4: A nyitott AI rendszerek új generációja a Meta -tól

A láma 4 kiderült: Metas kulcs a következő AI -korhoz

A Meta 2025. április 5 -én mutatta be AI modelljeinek, a Llama 4 legújabb generációját. Ezek az új modellek jelentős előrelépést jelentenek a nyílt AI rendszerek fejlesztésében, és számos úttörő funkcióval rendelkeznek, amelyek jelentősen növelik teljesítményüket és hatékonyságukat. A Llama 4 sorozat különböző modellekből áll, amelyek közül kettő már nyilvánosan elérhető, míg a legerősebb modell még mindig az edzési szakaszban van.

Alkalmas:

A láma 4 modell család

A Meta három különböző modellt fejlesztett ki a Llama 4 sorozatban, amelyek mindegyikét különböző alkalmazásokhoz optimalizálták:

Láma 4 cserkész

A Llama 4 Scout egy kompakt modell, lenyűgöző műszaki előírásokkal:

  • 17 milliárd aktív paraméter 16 szakértővel (összesen 109 milliárd paraméter)
  • Üzemeltethető egyetlen NVIDIA H100 GPU -n, INT4 kvantálással
  • Rendkívül nagy kontextusú ablaka van, 10 millió token, ami az egyik első nyitott modellt teszi ezzel a kapacitással

A Meta szerint a Scout meghaladja az osztály többi modelljét, például a Gemini 3, a Gemini 2.0 Flash-Lite és a Mistral 3.1. Különösen alkalmas olyan feladatokra, mint például a hosszú dokumentumok összefoglalása, a felhasználói adatokon alapuló személyre szabás és a nagy mennyiségű tudásról szóló összetett következtetések.

Láma 4 Maverick

A Llama 4 Maverick a két elérhető modell közül a hatalmasabb:

  • 17 milliárd aktív paraméter 128 szakértővel (összesen 400 milliárd paraméter)
  • A kísérleti csevegési verzió elérte az Elo 1417 -et az Lmarena -n
  • Meghaladja a modelleket, mint például a GPT-4O és a Gemini 2.0 Flash számos referenciaértékben

Ez a modell különösen alkalmas általános segítségnyújtáshoz és csevegési alkalmazásokhoz, például a kreatív íráshoz, és olyan eredményeket mutat, amelyek összehasonlíthatók a DeepSeek V3 -hoz az érvelési és kódolási feladatokban, de a paraméterek felével.

Láma 4 behemoth

A Llama 4 Behemoth a Metas legerősebb modellje, amely még nem áll rendelkezésre nyilvánosan:

  • 288 milliárd aktív paraméter 16 szakértővel (összesen csaknem 2 trillió paraméter)
  • A Meta szerint ez meghaladja a GPT-4,5, a Claude Sonnet 3.7 és a Gemini 2.0 Pro több STEM referenciaértéket.
  • „Tanári modellként” szolgál a kisebb láma 4 modellek számára

Behemoth jelenleg még mindig az edzési szakaszban van, és később közzéteszik.

Műszaki innovációk

A Llama 4 modell sorozat számos fontos műszaki innovációt vezet be, amelyek javítják teljesítményüket és hatékonyságukat:

Szakértői (MOE) építészet keveréke

A Llama 4 egyik legfontosabb innovációja a szakértői (MOE) építészet keveréke, amelyben a modellparamétereknek csak egy része aktiválódik minden tokenhez:

  • Ez jelentősen csökkenti a számítási erőfeszítéseket és a késleltetést, miközben a nagy teljesítményt megőrzik
  • A Llama 4 Mavericknél mindegyik tokent egy közös szakértő és a 128 -as zaklatott szakértő egyike dolgozza fel
  • Ez az architektúra lehetővé teszi a modell teljes paraméterének növelését anélkül, hogy növelné a következtetési költségeket

Natív multimodalitás a korai fúzióval

A Llama 4 az első nyitott modell, amelynek korai fúziója natív multimodalitással rendelkezik:

  • A szöveges és a kép tokenek integrálódnak az egységes modell architektúrába
  • Ez lehetővé teszi a közös előzetes képzést nagy mennyiségű szöveg-, kép- és videoadat -adatokkal
  • A Llama 3.2 -rel ellentétben, amely külön paramétereket használt a szöveghez és a képekhez, a Llama 4 megérti mindkét natív modalitást, azonos paraméterekkel

Rendkívül hosszú kontextus ablak

A Llama 4 Scout rendkívül hosszú kontextusú ablaka különösen lenyűgöző:

  • 10 millió tokennel egyértelműen meghaladja a rendelkezésre álló modelleket
  • Ez lehetővé teszi a nagyon hosszú dokumentumok, a teljes kódbázisok vagy a kiterjedt beszélgetések feldolgozását
  • Az Irope architektúrája (átlapolt figyelemrétegek) ezt lehetővé teszik

Új képzési módszerek

A Meta számos innovatív módszert alkalmazott a Llama 4 képzéséhez:

  • Metap: A kritikus modell hiperaméter robusztus koordinációjának technikája
  • FP8 Precision: 8 bites csúszásszámok használata a hatékony edzéshez
  • Distilláció: A láma 4 behemoth használata tanári modellként kisebb modellekhez
  • Teljesen aszinkron online tanulás megerősítésekkel: Új infrastruktúra a nagyszabású tanuláshoz

Elérhetőség és integráció

A LLAMA 4 modellek különböző platformokon és szolgáltatásokon keresztül érhetők el:

Letöltés és felhő szolgáltató

  • A Scout és a Maverick modelleket közvetlenül a meta -ról vagy az ölelés útján lehet letölteni
  • Különböző felhőplatformokon keresztül is elérhetők:
    • Cloudflare munkások AI
    • Azure AI Foundry és Azure Databricks
    • A Google Cloud's Vertex AI
    • Más partnerek az elkövetkező napokban követik

Integráció a meta termékekbe

A META már frissítette AI asszisztenseit a LLAMA 4 különféle platformjain:

  • A WhatsApp, a Messenger és az Instagram Direct 40 különböző országban
  • A Meta.AI weboldala
  • A multimodális funkciók azonban jelenleg csak az angol nyelvű felhasználók számára érhetők el az USA -ban

Alkalmas:

Engedély és vita

Noha a Meta llama 4 a „nyílt forráskódú” -ra utal, a licencben vannak korlátozások, amelyek vitát váltottak ki:

Licenc korlátozások

A LLAMA 4 közösségi engedély számos korlátozást tartalmaz:

  • A több mint 700 millió havi aktív felhasználóval rendelkező vállalatoknak speciális licencre van szükségük a Meta -tól
  • A modellek nyilvánvalóan nem engedhetik meg, hogy az EU -tól használják vagy terjesszék a felhasználókat és a vállalatokat, feltehetően a szabályozási követelmények miatt
  • Vannak követelmények a származtatott modellek elnevezésére és hozzárendelésére

Vita a „nyílt forráskódról”

Vita folyik arról, hogy a Llama 4 -et valóban „nyílt forráskódúnak” kell -e nevezni:

  • A nyílt forráskódú kezdeményezés 2023 -ban azt találta, hogy a Llama licenc korlátozásai a „nyílt forráskódú” kategóriából származnak
  • A kritikusok azt állítják, hogy ez inkább egy „forrás-nyitott” vagy „nyitott súlyú” modell, mint a valódi nyílt forráskódú szoftver
  • A licenckorlátozások problémás lehetnek a kisvállalatok számára, nincs saját jogi osztályuk nélkül

Jövőbeli tervek

A Meta már betekintést adott a Llama 4 és azon túl jövőbeli terveibe:

Llamacon és egyéb bejelentések

  • A Meta 2025. április 29 -én rendezi az első Llamacon konferenciát, amelyben az AI modellekről és terméktervekről további részleteket kell bejelenteni
  • A társaság azt is tervezi, hogy a második negyedévben külön kérelmet tesz közzé a Meta-Chat bot számára

A nyelvi készségek bővítése

  • A Meta a Llama 4 nyelvtudásának fejlesztésén dolgozik, hogy lehetővé tegye a természetes beszélgetéseket
  • A cél az, hogy lehetővé tegye a folyékony, kétoldalú párbeszédeket, amelyekben a felhasználók megszakíthatják az AI modellt
  • Chris Cox, a Meta terméktisztviselője a közelgő Llama 4 -et „Omni modellnek” írta le, amely lehetővé teszi az anyanyelvt, ahelyett, hogy a nyelvet szövegbe fordítaná, ahelyett

Agentic AI és kibővített készségek

  • Mark Zuckerberg bejelentette, hogy a Llama 4 -nek „ügynöki képességei” lesznek, amelyek lehetővé teszik az új alkalmazásokat
  • A Meta célja az AI modellek kidolgozása, amelyek „általánosított cselekedeteket hajtanak végre, természetesen kommunikálnak az emberekkel és megoldják a kihívásokkal teli problémákat”
  • A társaság fontolóra veszi a prémium előfizetések ajánlását AI -asszisztensnek ügynöki célokra, például foglalások vagy videofelvételek

Miért fordulópont a Llama 4 fordulópont az AI tájban

A Llama 4 közzététele jelentős lépést jelent a metas stratégiájában, hogy a generatív AI vezető területévé váljon a rendkívül versenyképes területen. A szakértői architektúra, a natív multimodalitás és a lenyűgözően hosszú kontextusú ablakok bevezetésével a Meta azt mutatja, hogy a nyitott modellek lépést tudnak tartani a nagy technológiai vállalatok védett modelljeivel.

Annak ellenére, hogy az engedélyezéssel és az a kérdés, hogy a Llama 4 -et valóban „nyílt forrású” -nak nevezzük, a műszaki fejlődés fontos mérföldkő. A modellek képessége mind a szöveg, mind a képek feldolgozására új lehetőségeket kínál a fejlesztők és a vállalatok számára.

A kiemelkedő Llama 4 Behemoth és a kibővített nyelvi és ügynöki készségek bejelentett terveivel egyértelmű, hogy a Meta tovább fokozza az AI -be történő befektetéseit. Az elkövetkező hónapok megmutatják, hogy ezek az új modellek hogyan változtatják meg az AI tájat, és hogy - amint azt Mark Zuckerberg megjósolta, valóban segítenek -e a nyitott AI modellek elkészítésében a mesterséges intelligencia területén.

Alkalmas:

 

Az Ön globális marketing- és üzletfejlesztési partnere

☑️ Üzleti nyelvünk angol vagy német

☑️ ÚJ: Levelezés az Ön nemzeti nyelvén!

 

Digitális úttörő – Konrad Wolfenstein

Konrad Wolfenstein

Szívesen szolgálok Önt és csapatomat személyes tanácsadóként.

Felveheti velem a kapcsolatot az itt található kapcsolatfelvételi űrlap kitöltésével , vagy egyszerűen hívjon a +49 89 89 674 804 (München) . Az e-mail címem: wolfenstein xpert.digital

Nagyon várom a közös projektünket.

 

 

☑️ KKV-k támogatása stratégiában, tanácsadásban, tervezésben és megvalósításban

☑️ Digitális stratégia és digitalizáció megalkotása vagy átrendezése

☑️ Nemzetközi értékesítési folyamatok bővítése, optimalizálása

☑️ Globális és digitális B2B kereskedési platformok

☑️ Úttörő üzletfejlesztés / Marketing / PR / Szakkiállítások


⭐️ Mesterséges intelligencia (AI) -i blog, hotspot és tartalmi hub ⭐️ Digitális intelligencia ⭐️ Xpaper