Publicerad: 6 april 2025 / UPDATE FrÄn: 6 april 2025 - Författare: Konrad Wolfenstein
Llama 4: Den nya generationen av öppna AI -system frÄn META
Llama 4 avslöjade: Metas nyckeln till nÀsta AI -Älder
Meta presenterade den senaste generationen av sina AI -modeller, Llama 4, den 5 april 2025. Dessa nya modeller representerar betydande framsteg i utvecklingen av öppna AI -system och har ett antal banbrytande funktioner som vÀsentligt ökar deras prestanda och effektivitet. Llama 4 -serien bestÄr av olika modeller, med tvÄ av dem redan offentligt tillgÀngliga, medan den mest kraftfulla modellen fortfarande Àr i trÀningsfasen.
LÀmplig för detta:
Llama 4 -modellfamiljen
Meta har utvecklat tre olika modeller i Llama 4 -serien, som var och en Àr optimerad för olika applikationer:
Lama 4 scout
Llama 4 Scout Àr en kompakt modell med imponerande tekniska specifikationer:
- 17 miljarder aktiva parametrar med 16 experter (totalt 109 miljarder parametrar)
- Kan drivas pÄ en enda NVIDIA H100 GPU med INT4 -kvantisering
- Har ett anmÀrkningsvÀrt stort sammanhangsfönster pÄ 10 miljoner symboler, vilket gör det till en av de första öppna modellerna med denna kapacitet
Enligt Meta överskrider Scout andra modeller i sin klass som Gemini 3, Gemini 2.0 Flash-Lite och Mistral 3.1. Det Àr sÀrskilt lÀmpligt för uppgifter som sammanfattningen av lÄnga dokument, personalisering baserad pÄ anvÀndardata och komplexa slutsatser om stora mÀngder kunskap.
Lama 4 maverick
Llama 4 Maverick Àr den kraftfullare av de tvÄ tillgÀngliga modellerna:
- 17 miljarder aktiva parametrar med 128 experter (totalt 400 miljarder parametrar)
- Den experimentella chattversionen nÄdde Elo 1417 pÄ LMarena
- Ăverskrider modeller som GPT-4O och Gemini 2.0 Flash i mĂ„nga riktmĂ€rken
Denna modell Àr sÀrskilt lÀmplig för allmÀn hjÀlp och chattapplikationer som kreativt skrivande och visar resultat som Àr jÀmförbara med Deepseek V3 vid resonemang och kodningsuppgifter, men med hÀlften av parametrarna.
Lama 4 behemoth
Llama 4 Behemoth Àr Metas mest kraftfulla modell, som Ànnu inte Àr offentligt tillgÀnglig:
- 288 miljarder aktiva parametrar med 16 experter (totalt nÀstan 2 biljoner parametrar)
- Enligt Meta överskrider den GPT-4,5, Claude Sonnet 3.7 och Gemini 2.0 Pro för flera stammarknader
- Fungerar som en "lÀrarmodell" för de mindre Llama 4 -modellerna
Behemoth Àr för nÀrvarande fortfarande i trÀningsfasen och kommer att publiceras vid ett senare tillfÀlle.
Tekniska innovationer
Llama 4 -modellserien introducerar flera viktiga tekniska innovationer som förbÀttrar deras prestanda och effektivitet:
Blandning av experter (MOE) arkitektur
En av de viktigaste innovationerna pÄ Llama 4 Àr blandningen av experter (MOE) arkitektur, dÀr endast en del av modellparametrarna aktiveras för varje symbol:
- Detta minskar avsevÀrt berÀkningsinsatsen och latensen, medan den höga prestationen bevaras
- PĂ„ Llama 4 Maverick behandlas varje symbol av en gemensam expert och en av 128 Geriserade experter
- Denna arkitektur gör det möjligt att öka modellens totala parameter utan att öka inferenskostnaderna
Native multimodalitet med tidig fusion
Llama 4 Àr den första öppna modellen med nativ multimodalitet genom tidig fusion:
- Text- och bildtokens Àr integrerade i en enhetlig modellarkitektur
- Detta möjliggör gemensam preliminÀr utbildning med stora mÀngder text, bild- och videodata
- Till skillnad frÄn Llama 3.2, som anvÀnde separata parametrar för text och bilder, förstÄr Llama 4 bÄda metoderna med samma parametrar
Extremt lÄngt sammanhangsfönster
Det extremt lÄnga sammanhangsfönstret för Llama 4 Scout Àr sÀrskilt imponerande:
- Med 10 miljoner symboler överstiger det tydligt de flesta av de tillgÀngliga modellerna
- Detta möjliggör behandling av mycket lÄnga dokument, hela kodbaser eller omfattande samtal
- Irope -arkitekturen (sammanflÀtade uppmÀrksamhetslager) gör detta möjligt
Nya trÀningsmetoder
Meta har anvÀnt flera innovativa metoder för utbildning av Llama 4:
- Metap: En teknik för robust koordination av kritisk modellhyperameter
- FP8 Precision: AnvÀndning av 8-bitars glidgjorda nummer för effektiv trÀning
- SamförestÀllning: AnvÀndning av Llama 4 Behemoth som lÀrarmodell för mindre modeller
- Helt asynkron onlineinlÀrning med förstÀrkningar: En ny infrastruktur för storskalig lÀrande
TillgÀnglighet och integration
Llama 4 -modellerna Àr tillgÀngliga via olika plattformar och tjÀnster:
Ladda ner och molnleverantör
- Models Scout och Maverick kan laddas ner direkt frÄn Meta eller via kram Face
- De Àr ocksÄ tillgÀngliga via olika molnplattformar:
- Cloudflare -arbetare ai
- Azure Ai Foundry och Azure Databricks
- Google Cloud's Vertex Ai
- Andra partners kommer att följa de kommande dagarna
Integration i metaprodukter
Meta har redan uppdaterat sina AI -assistenter pÄ olika plattformar pÄ Llama 4:
- WhatsApp, Messenger och Instagram direkt i 40 olika lÀnder
- Meta.ai -webbplatsen
- Men de multimodala funktionerna Àr för nÀrvarande endast tillgÀngliga för engelska sprÄkanvÀndare i USA
LÀmplig för detta:
- Meta AI i Tyskland Àr hÀr! WhatsApp, Instagram & Facebook FÄ AI-med viktiga skillnader i den amerikanska versionen
Licens och kontroverser
Ăven om Meta Llama 4 hĂ€nvisar till "öppen kĂ€llkod", finns det vissa begrĂ€nsningar i licensen som utlöste kontrovers:
LicensbegrÀnsningar
Llama 4 Community -licensen innehÄller flera begrÀnsningar:
- Företag med mer Àn 700 miljoner aktiva anvÀndare varje mÄnad behöver en speciell licens frÄn META
- Modellerna fÄr uppenbarligen inte anvÀnda eller distribuera anvÀndare och företag frÄn EU, förmodligen pÄ grund av lagstiftningskrav
- Det finns krav pÄ namngivning och tillskrivning för hÀrledda modeller
Debatt om "Open Source"
Det diskuteras om Llama 4 faktiskt bör kallas âöppen kĂ€llkodâ:
- Open Source -initiativet fann 2023 att begrÀnsningarna i Llama -licensen tar ut den "frÄn kategorin" Open Source ""
- Kritiker hÀvdar att det Àr mer av en "kÀllöppen" eller "med öppna vikter" Àn riktig öppen kÀllkodsprogramvara
- LicensbegrÀnsningarna kan vara problematiska för smÄ företag utan sina egna lagliga avdelningar
Framtida planer
Meta har redan gett lite insikt i sina framtida planer för Llama 4 och dÀrefter:
Llamacon och andra tillkÀnnagivanden
- Meta kommer att organisera den första Llamacon -konferensen den 29 april 2025, dÀr ytterligare information om sina AI -modeller och produktplaner ska meddelas
- Företaget planerar ocksÄ att publicera en dedikerad ansökan om sin Meta-Chat Bot under andra kvartalet
Utvidgning av sprÄkkunskaper
- Meta arbetar med att förbÀttra Llama 4: s sprÄkkunskaper för att möjliggöra mer naturliga samtal
- MÄlet Àr att möjliggöra mer flytande, tvÄsidiga dialoger dÀr anvÀndare kan avbryta AI-modellen
- Chris Cox, Chief Product Officer för Meta, beskrev den kommande Llama 4 som en "Omni -modell" som möjliggör modersmÄl istÀllet för att översÀtta sprÄk till text till text
Agentisk AI och utökade fÀrdigheter
- Mark Zuckerberg har meddelat att Llama 4 kommer att ha "agentfÀrdigheter" som borde möjliggöra nya applikationer
- Meta syftar till att utveckla AI -modeller som "genomför generaliserade ÄtgÀrder, naturligtvis kommunicerar med mÀnniskor och löser utmanande problem"
- Företaget övervÀger att erbjuda premiumabonnemang för sin AI -assistent för agentÀndamÄl som reservationer eller videoproduktion
Varför Llama 4 Àr en vÀndpunkt i AI -landskapet
Publiceringen av Llama 4 representerar ett betydande steg i Metas -strategin för att bli det ledande omrÄdet för den generativa AI i det mycket konkurrenskraftiga omrÄdet. Med introduktionen av blandningen av experterarkitektur, infödda multimodalitet och ett imponerande lÄngt sammanhangsfönster visar Meta att öppna modeller kan hÄlla jÀmna steg med de egna modellerna för de stora teknikföretagen.
Trots kontroversen om licensieringen och frÄgan om Llama 4 verkligen bör kallas en "öppen kÀllkod" Àr tekniska framsteg en viktig milstolpe. Modellernas förmÄga att bearbeta bÄde text och bilder öppnar nya möjligheter för utvecklare och företag.
Med den enastÄende Llama 4 Behemoth och de tillkÀnnagivna planerna för utvidgade sprÄk- och agentfÀrdigheter Àr det uppenbart att META ytterligare kommer att intensifiera sina investeringar i AI. De kommande mÄnaderna kommer att visa hur dessa nya modeller förÀndrar AI -landskapet och om de, som förutses av Mark Zuckerberg, faktiskt kommer att hjÀlpa till att öppna AI -modeller inom konstgjord intelligens.
LÀmplig för detta:
Â
Din globala marknadsförings- och affÀrsutvecklingspartner
â VĂ„rt affĂ€rssprĂ„k Ă€r engelska eller tyska
â Nytt: korrespondens pĂ„ ditt nationella sprĂ„k!
Â
Jag Àr glad att vara tillgÀnglig för dig och mitt team som personlig konsult.
Du kan kontakta mig genom att fylla i kontaktformulĂ€ret eller helt enkelt ringa mig pĂ„ +49 89 674 804 (MĂŒnchen) . Min e -postadress Ă€r: Wolfenstein â xpert.digital
Jag ser fram emot vÄrt gemensamma projekt.
Â
Â