Röstval 📱


Meta publicerar New Llama 4 Scout, Maverick och Behemoth

Publicerad: 6 april 2025 / UPDATE FrÄn: 6 april 2025 - Författare: Konrad Wolfenstein

Meta publicerar New Llama 4 Scout, Maverick och Behemoth

Meta publicerar New Lama 4 Scout, Maverick och Behemoth-Image: Xpert.Digital

Llama 4: Den nya generationen av öppna AI -system frÄn META

Llama 4 avslöjade: Metas nyckeln till nÀsta AI -Älder

Meta presenterade den senaste generationen av sina AI -modeller, Llama 4, den 5 april 2025. Dessa nya modeller representerar betydande framsteg i utvecklingen av öppna AI -system och har ett antal banbrytande funktioner som vÀsentligt ökar deras prestanda och effektivitet. Llama 4 -serien bestÄr av olika modeller, med tvÄ av dem redan offentligt tillgÀngliga, medan den mest kraftfulla modellen fortfarande Àr i trÀningsfasen.

LÀmplig för detta:

Llama 4 -modellfamiljen

Meta har utvecklat tre olika modeller i Llama 4 -serien, som var och en Àr optimerad för olika applikationer:

Lama 4 scout

Llama 4 Scout Àr en kompakt modell med imponerande tekniska specifikationer:

  • 17 miljarder aktiva parametrar med 16 experter (totalt 109 miljarder parametrar)
  • Kan drivas pĂ„ en enda NVIDIA H100 GPU med INT4 -kvantisering
  • Har ett anmĂ€rkningsvĂ€rt stort sammanhangsfönster pĂ„ 10 miljoner symboler, vilket gör det till en av de första öppna modellerna med denna kapacitet

Enligt Meta överskrider Scout andra modeller i sin klass som Gemini 3, Gemini 2.0 Flash-Lite och Mistral 3.1. Det Àr sÀrskilt lÀmpligt för uppgifter som sammanfattningen av lÄnga dokument, personalisering baserad pÄ anvÀndardata och komplexa slutsatser om stora mÀngder kunskap.

Lama 4 maverick

Llama 4 Maverick Àr den kraftfullare av de tvÄ tillgÀngliga modellerna:

  • 17 miljarder aktiva parametrar med 128 experter (totalt 400 miljarder parametrar)
  • Den experimentella chattversionen nĂ„dde Elo 1417 pĂ„ LMarena
  • Överskrider modeller som GPT-4O och Gemini 2.0 Flash i mĂ„nga riktmĂ€rken

Denna modell Àr sÀrskilt lÀmplig för allmÀn hjÀlp och chattapplikationer som kreativt skrivande och visar resultat som Àr jÀmförbara med Deepseek V3 vid resonemang och kodningsuppgifter, men med hÀlften av parametrarna.

Lama 4 behemoth

Llama 4 Behemoth Àr Metas mest kraftfulla modell, som Ànnu inte Àr offentligt tillgÀnglig:

  • 288 miljarder aktiva parametrar med 16 experter (totalt nĂ€stan 2 biljoner parametrar)
  • Enligt Meta överskrider den GPT-4,5, Claude Sonnet 3.7 och Gemini 2.0 Pro för flera stammarknader
  • Fungerar som en "lĂ€rarmodell" för de mindre Llama 4 -modellerna

Behemoth Àr för nÀrvarande fortfarande i trÀningsfasen och kommer att publiceras vid ett senare tillfÀlle.

Tekniska innovationer

Llama 4 -modellserien introducerar flera viktiga tekniska innovationer som förbÀttrar deras prestanda och effektivitet:

Blandning av experter (MOE) arkitektur

En av de viktigaste innovationerna pÄ Llama 4 Àr blandningen av experter (MOE) arkitektur, dÀr endast en del av modellparametrarna aktiveras för varje symbol:

  • Detta minskar avsevĂ€rt berĂ€kningsinsatsen och latensen, medan den höga prestationen bevaras
  • PĂ„ Llama 4 Maverick behandlas varje symbol av en gemensam expert och en av 128 Geriserade experter
  • Denna arkitektur gör det möjligt att öka modellens totala parameter utan att öka inferenskostnaderna

Native multimodalitet med tidig fusion

Llama 4 Àr den första öppna modellen med nativ multimodalitet genom tidig fusion:

  • Text- och bildtokens Ă€r integrerade i en enhetlig modellarkitektur
  • Detta möjliggör gemensam preliminĂ€r utbildning med stora mĂ€ngder text, bild- och videodata
  • Till skillnad frĂ„n Llama 3.2, som anvĂ€nde separata parametrar för text och bilder, förstĂ„r Llama 4 bĂ„da metoderna med samma parametrar

Extremt lÄngt sammanhangsfönster

Det extremt lÄnga sammanhangsfönstret för Llama 4 Scout Àr sÀrskilt imponerande:

  • Med 10 miljoner symboler överstiger det tydligt de flesta av de tillgĂ€ngliga modellerna
  • Detta möjliggör behandling av mycket lĂ„nga dokument, hela kodbaser eller omfattande samtal
  • Irope -arkitekturen (sammanflĂ€tade uppmĂ€rksamhetslager) gör detta möjligt

Nya trÀningsmetoder

Meta har anvÀnt flera innovativa metoder för utbildning av Llama 4:

  • Metap: En teknik för robust koordination av kritisk modellhyperameter
  • FP8 Precision: AnvĂ€ndning av 8-bitars glidgjorda nummer för effektiv trĂ€ning
  • SamförestĂ€llning: AnvĂ€ndning av Llama 4 Behemoth som lĂ€rarmodell för mindre modeller
  • Helt asynkron onlineinlĂ€rning med förstĂ€rkningar: En ny infrastruktur för storskalig lĂ€rande

TillgÀnglighet och integration

Llama 4 -modellerna Àr tillgÀngliga via olika plattformar och tjÀnster:

Ladda ner och molnleverantör

  • Models Scout och Maverick kan laddas ner direkt frĂ„n Meta eller via kram Face
  • De Ă€r ocksĂ„ tillgĂ€ngliga via olika molnplattformar:
    • Cloudflare -arbetare ai
    • Azure Ai Foundry och Azure Databricks
    • Google Cloud's Vertex Ai
    • Andra partners kommer att följa de kommande dagarna

Integration i metaprodukter

Meta har redan uppdaterat sina AI -assistenter pÄ olika plattformar pÄ Llama 4:

  • WhatsApp, Messenger och Instagram direkt i 40 olika lĂ€nder
  • Meta.ai -webbplatsen
  • Men de multimodala funktionerna Ă€r för nĂ€rvarande endast tillgĂ€ngliga för engelska sprĂ„kanvĂ€ndare i USA

LÀmplig för detta:

Licens och kontroverser

Även om Meta Llama 4 hĂ€nvisar till "öppen kĂ€llkod", finns det vissa begrĂ€nsningar i licensen som utlöste kontrovers:

LicensbegrÀnsningar

Llama 4 Community -licensen innehÄller flera begrÀnsningar:

  • Företag med mer Ă€n 700 miljoner aktiva anvĂ€ndare varje mĂ„nad behöver en speciell licens frĂ„n META
  • Modellerna fĂ„r uppenbarligen inte anvĂ€nda eller distribuera anvĂ€ndare och företag frĂ„n EU, förmodligen pĂ„ grund av lagstiftningskrav
  • Det finns krav pĂ„ namngivning och tillskrivning för hĂ€rledda modeller

Debatt om "Open Source"

Det diskuteras om Llama 4 faktiskt bör kallas â€Ă¶ppen kĂ€llkod”:

  • Open Source -initiativet fann 2023 att begrĂ€nsningarna i Llama -licensen tar ut den "frĂ„n kategorin" Open Source ""
  • Kritiker hĂ€vdar att det Ă€r mer av en "kĂ€llöppen" eller "med öppna vikter" Ă€n riktig öppen kĂ€llkodsprogramvara
  • LicensbegrĂ€nsningarna kan vara problematiska för smĂ„ företag utan sina egna lagliga avdelningar

Framtida planer

Meta har redan gett lite insikt i sina framtida planer för Llama 4 och dÀrefter:

Llamacon och andra tillkÀnnagivanden

  • Meta kommer att organisera den första Llamacon -konferensen den 29 april 2025, dĂ€r ytterligare information om sina AI -modeller och produktplaner ska meddelas
  • Företaget planerar ocksĂ„ att publicera en dedikerad ansökan om sin Meta-Chat Bot under andra kvartalet

Utvidgning av sprÄkkunskaper

  • Meta arbetar med att förbĂ€ttra Llama 4: s sprĂ„kkunskaper för att möjliggöra mer naturliga samtal
  • MĂ„let Ă€r att möjliggöra mer flytande, tvĂ„sidiga dialoger dĂ€r anvĂ€ndare kan avbryta AI-modellen
  • Chris Cox, Chief Product Officer för Meta, beskrev den kommande Llama 4 som en "Omni -modell" som möjliggör modersmĂ„l istĂ€llet för att översĂ€tta sprĂ„k till text till text

Agentisk AI och utökade fÀrdigheter

  • Mark Zuckerberg har meddelat att Llama 4 kommer att ha "agentfĂ€rdigheter" som borde möjliggöra nya applikationer
  • Meta syftar till att utveckla AI -modeller som "genomför generaliserade Ă„tgĂ€rder, naturligtvis kommunicerar med mĂ€nniskor och löser utmanande problem"
  • Företaget övervĂ€ger att erbjuda premiumabonnemang för sin AI -assistent för agentĂ€ndamĂ„l som reservationer eller videoproduktion

Varför Llama 4 Àr en vÀndpunkt i AI -landskapet

Publiceringen av Llama 4 representerar ett betydande steg i Metas -strategin för att bli det ledande omrÄdet för den generativa AI i det mycket konkurrenskraftiga omrÄdet. Med introduktionen av blandningen av experterarkitektur, infödda multimodalitet och ett imponerande lÄngt sammanhangsfönster visar Meta att öppna modeller kan hÄlla jÀmna steg med de egna modellerna för de stora teknikföretagen.

Trots kontroversen om licensieringen och frÄgan om Llama 4 verkligen bör kallas en "öppen kÀllkod" Àr tekniska framsteg en viktig milstolpe. Modellernas förmÄga att bearbeta bÄde text och bilder öppnar nya möjligheter för utvecklare och företag.

Med den enastÄende Llama 4 Behemoth och de tillkÀnnagivna planerna för utvidgade sprÄk- och agentfÀrdigheter Àr det uppenbart att META ytterligare kommer att intensifiera sina investeringar i AI. De kommande mÄnaderna kommer att visa hur dessa nya modeller förÀndrar AI -landskapet och om de, som förutses av Mark Zuckerberg, faktiskt kommer att hjÀlpa till att öppna AI -modeller inom konstgjord intelligens.

LÀmplig för detta:

 

Din globala marknadsförings- och affÀrsutvecklingspartner

☑ VĂ„rt affĂ€rssprĂ„k Ă€r engelska eller tyska

☑ Nytt: korrespondens pĂ„ ditt nationella sprĂ„k!

 

Digital Pioneer - Konrad Wolfenstein

Konrad Wolfenstein

Jag Àr glad att vara tillgÀnglig för dig och mitt team som personlig konsult.

Du kan kontakta mig genom att fylla i kontaktformulĂ€ret eller helt enkelt ringa mig pĂ„ +49 89 674 804 (MĂŒnchen) . Min e -postadress Ă€r: Wolfenstein ∂ xpert.digital

Jag ser fram emot vÄrt gemensamma projekt.

 

 

☑ SME -stöd i strategi, rĂ„dgivning, planering och implementering

☑ skapande eller omjustering av den digitala strategin och digitaliseringen

☑ Expansion och optimering av de internationella försĂ€ljningsprocesserna

☑ Globala och digitala B2B -handelsplattformar

☑ Pioneer Business Development / Marketing / PR / Measure


⭐ Artificial Intelligence (AI) -AI-blogg, hotspot och innehĂ„llsnav ⭐ Digital intelligens ⭐ Xpaper Â