Pubblicato il 6 aprile 2025 / Aggiornamento dal 6 aprile 2025 - Autore: Konrad Wolfenstein
Llama 4: la nuova generazione di sistemi AI aperti da Meta
Llama 4 rivelato: Metas Key to the Next AI Age
Meta ha presentato l'ultima generazione dei suoi modelli AI, Llama 4, il 5 aprile 2025. Questi nuovi modelli rappresentano progressi significativi nello sviluppo di sistemi AI aperti e hanno una serie di funzioni innovative che aumentano significativamente le loro prestazioni ed efficienza. La serie Llama 4 è composta da diversi modelli, con due già pubblicamente disponibili pubblicamente, mentre il modello più potente è ancora in fase di formazione.
Adatto a:
- Semplicemente spiegati i modelli di intelligenza artificiale: comprendere le basi dell'intelligenza artificiale, dei modelli vocali e del ragionamento
La famiglia modello Llama 4
Meta ha sviluppato tre diversi modelli nella serie Llama 4, ognuno dei quali è ottimizzato per diverse applicazioni:
Llama 4 Scout
Llama 4 Scout è un modello compatto con impressionanti specifiche tecniche:
- 17 miliardi di parametri attivi con 16 esperti (un totale di 109 miliardi di parametri)
- Può essere gestito su una singola GPU Nvidia H100 con quantizzazione INT4
- Ha una finestra di contesto straordinariamente grande di 10 milioni di token, il che lo rende uno dei primi modelli aperti con questa capacità
Secondo Meta, Scout supera altri modelli nella sua classe come Gemini 3, Gemini 2.0 Flash-Lite e Mistral 3.1. È particolarmente adatto per compiti come il riepilogo di documenti lunghi, la personalizzazione basata sui dati degli utenti e le complesse conclusioni su grandi quantità di conoscenza.
Llama 4 Maverick
Llama 4 Maverick è il più potente dei due modelli disponibili:
- 17 miliardi di parametri attivi con 128 esperti (un totale di 400 miliardi di parametri)
- La versione di chat sperimentale ha raggiunto ELO 1417 su LMarena
- Supera modelli come GPT-4O e Gemini 2.0 Flash in numerosi parametri di riferimento
Questo modello è particolarmente adatto per l'assistenza generale e le applicazioni di chat come la scrittura creativa e mostra risultati paragonabili a DeepSeek V3 nelle attività di ragionamento e codifica, ma con metà dei parametri.
Llama 4 Behemoth
Llama 4 Behemoth è il modello più potente di Metas, che non è ancora pubblicamente disponibile:
- 288 miliardi di parametri attivi con 16 esperti (un totale di quasi 2 trilioni di parametri)
- Secondo Meta, supera GPT-4.5, Claude Sonnet 3.7 e Gemini 2.0 Pro per diversi parametri STEM
- Funge da "modello di insegnante" per i modelli Llama 4 più piccoli
Behemoth è attualmente ancora in fase di allenamento e sarà pubblicato in un secondo momento.
Innovazioni tecniche
La serie modello Llama 4 introduce diverse importanti innovazioni tecniche che migliorano le loro prestazioni ed efficienza:
Architettura della miscela di esperti (MOE)
Una delle innovazioni più importanti di Llama 4 è la miscela di architettura di esperti (MOE), in cui solo una parte dei parametri del modello viene attivata per ogni token:
- Ciò riduce significativamente lo sforzo di calcolo e la latenza, mentre le alte prestazioni sono conservate
- A Llama 4 Maverick, ogni token viene elaborato da un esperto comune e uno dei 128 esperti ganizzati
- Questa architettura consente di aumentare il parametro totale del modello senza aumentare i costi di inferenza
Multimodalità nativa con fusione precoce
Llama 4 è il primo modello aperto con multimodalità nativa per Fusion precoce:
- I token di testo e immagine sono integrati in un'architettura del modello uniforme
- Ciò consente una formazione preliminare congiunta con grandi quantità di dati di testo, immagini e video
- Contrariamente a Llama 3.2, che utilizzava parametri separati per testi e immagini, Llama 4 comprende entrambe le modalità native con gli stessi parametri
Finestra di contesto estremamente lunga
La finestra di contesto estremamente lunga di Llama 4 Scout è particolarmente impressionante:
- Con 10 milioni di token, supera chiaramente la maggior parte dei modelli disponibili
- Ciò consente l'elaborazione di documenti molto lunghi, basi di codice intera o conversazioni estese
- L'architettura di Irope (strati di attenzione interlacciata) lo rende possibile
Nuovi metodi di allenamento
Meta ha utilizzato diversi metodi innovativi per la formazione di Llama 4:
- Metap: una tecnica per il robusto coordinamento del modello critico iperametro
- FP8 Precision: uso di numeri fabbricati a 8 bit per un allenamento efficiente
- Co-distillazione: uso di Llama 4 Behemoth come modello di insegnante per modelli più piccoli
- Apprendimento online completamente asincrono con rinforzi: una nuova infrastruttura per l'apprendimento su larga scala
Disponibilità e integrazione
I modelli Llama 4 sono disponibili tramite varie piattaforme e servizi:
Download e provider cloud
- I modelli scout e maverick possono essere scaricati direttamente da meta o tramite abbraccio
- Sono anche disponibili tramite varie piattaforme cloud:
- Cloudflare Worker AI
- Azure Ai Foundry e Azure Databricks
- Vertex AI di Google Cloud
- Altri partner seguiranno nei prossimi giorni
Integrazione in meta prodotti
Meta ha già aggiornato i suoi assistenti di intelligenza artificiale in varie piattaforme di Llama 4:
- WhatsApp, Messenger e Instagram direttamente in 40 paesi diversi
- Il sito Web Meta.AI
- Tuttavia, le funzioni multimodali sono attualmente disponibili solo per gli utenti di lingua inglese negli Stati Uniti
Adatto a:
- Meta Ai in Germania è qui! WhatsApp, Instagram e Facebook Ottieni AI, con differenze importanti nella versione americana
Licenza e controversie
Sebbene Meta Llama 4 si riferisca alla "open source", ci sono alcune restrizioni nella licenza che hanno scatenato la controversia:
Restrizioni di licenza
La licenza comunitaria Llama 4 contiene diverse restrizioni:
- Le aziende con oltre 700 milioni di utenti attivi mensili hanno bisogno di una licenza speciale da Meta
- Apparentemente i modelli non sono autorizzati a utilizzare o distribuire utenti e aziende dall'UE, presumibilmente a causa dei requisiti normativi
- Ci sono requisiti relativi alla denominazione e all'attribuzione per i modelli derivati
Dibattito su "open source"
C'è un dibattito sul fatto che Llama 4 debba effettivamente essere chiamato "open source":
- L'iniziativa open source ha scoperto nel 2023 che le restrizioni nella licenza Llama lo portano fuori dalla categoria "dalla" open source "
- I critici sostengono che è più un modello di "origine aperta" o "con pesi aperti" rispetto al vero software open source
- Le restrizioni di licenza potrebbero essere problematiche per le piccole aziende senza i propri dipartimenti legali
Piani futuri
Meta ha già fornito alcune intuizioni sui suoi piani futuri per Llama 4 e oltre:
Llamacon e altri annunci
- Meta organizzerà la prima conferenza Llamacon il 29 aprile 2025, in cui devono essere annunciati ulteriori dettagli sui suoi modelli AI e piani di prodotto
- La società prevede inoltre di pubblicare una domanda dedicata per il suo bot meta-chat nel secondo trimestre
Espansione delle abilità linguistiche
- Meta sta lavorando al miglioramento delle abilità linguistiche di Llama 4 per consentire conversazioni più naturali
- L'obiettivo è abilitare dialoghi più fluidi e bilaterali in cui gli utenti possono interrompere il modello AI
- Chris Cox, Chief Product Officer di Meta, ha descritto il prossimo Llama 4 come un "modello omni" che consente la lingua madre invece di tradurre il linguaggio in testo
AI agente e abilità estese
- Mark Zuckerberg ha annunciato che Llama 4 avrà "abilità degli agenti" che dovrebbero consentire nuove applicazioni
- Meta mira a sviluppare modelli di intelligenza artificiale che "svolgono azioni generalizzate, ovviamente comunicano con le persone e risolvono problemi difficili"
- La società sta prendendo in considerazione l'offerta di abbonamenti premium per il suo assistente di intelligenza artificiale a fini di agente come prenotazioni o produzione video
Perché Llama 4 è una svolta nel paesaggio dell'IA
La pubblicazione di Llama 4 rappresenta un passo significativo nella strategia Metas per diventare l'area principale dell'IA generativa nell'area altamente competitiva. Con l'introduzione della miscela di architettura degli esperti, multimodalità nativa e una finestra di contesto straordinariamente lunga, Meta mostra che i modelli aperti possono tenere il passo con i modelli proprietari delle grandi aziende tecnologiche.
Nonostante la controversia sulle licenze e sulla questione se Llama 4 debba davvero essere definito "open source", il progresso tecnico è una pietra miliare importante. La capacità dei modelli di elaborare sia il testo che le immagini apre nuove opportunità per sviluppatori e aziende.
Con l'eccezionale behemoth Llama 4 e i piani annunciati per le capacità di lingua e agente ampliate, è chiaro che Meta intensificherà ulteriormente i suoi investimenti nell'intelligenza artificiale. I prossimi mesi mostreranno come questi nuovi modelli cambiano il panorama dell'IA e se, come previsto da Mark Zuckerberg, aiuteranno effettivamente a realizzare modelli AI aperti nel campo dell'intelligenza artificiale.
Adatto a:
Il tuo partner globale per il marketing e lo sviluppo aziendale
☑️ La nostra lingua commerciale è l'inglese o il tedesco
☑️ NOVITÀ: corrispondenza nella tua lingua nazionale!
Sarei felice di servire te e il mio team come consulente personale.
Potete contattarmi compilando il modulo di contatto o semplicemente chiamandomi al numero +49 89 89 674 804 (Monaco) . Il mio indirizzo email è: wolfenstein ∂ xpert.digital
Non vedo l'ora di iniziare il nostro progetto comune.