Icona del sito web Xpert.Digital

Meta rilascia la nuova serie di modelli AI Llama 4 Scout, Maverick e Behemoth

Meta rilascia la nuova serie di modelli AI Llama 4 Scout, Maverick e Behemoth

Meta lancia la nuova serie di modelli AI Llama 4 Scout, Maverick e Behemoth – Immagine: Xpert.Digital

Llama 4: la nuova generazione di sistemi di intelligenza artificiale aperti di Meta

Llama 4 svelato: la chiave di Meta per la prossima era dell'intelligenza artificiale

Il 5 aprile 2025, Meta ha presentato l'ultima generazione dei suoi modelli di intelligenza artificiale, Llama 4. Questi nuovi modelli rappresentano un significativo passo avanti nello sviluppo di sistemi di intelligenza artificiale aperti e presentano una serie di funzionalità innovative che ne migliorano notevolmente le prestazioni e l'efficienza. La serie Llama 4 comprende diversi modelli, due dei quali sono già disponibili al pubblico, mentre il modello più potente è ancora in fase di addestramento.

Correlato a questo:

La famiglia di modelli Llama 4

Meta ha sviluppato tre diversi modelli della serie Llama 4, ognuno ottimizzato per diversi casi d'uso:

Lama 4 Scout

Llama 4 Scout è un modello compatto con specifiche tecniche impressionanti:

  • 17 miliardi di parametri attivi con 16 esperti (per un totale di 109 miliardi di parametri)
  • Può essere utilizzato su una singola GPU NVIDIA H100 con quantizzazione Int4
  • È dotato di una finestra di contesto notevolmente ampia, pari a 10 milioni di token, il che lo rende uno dei primi modelli aperti con questa capacità

Secondo Meta, Scout supera in prestazioni altri modelli della sua categoria, come Gemini 3, Gemini 2.0 Flash-Lite e Mistral 3.1. È particolarmente adatto per attività come la sintesi di documenti lunghi, la personalizzazione dei contenuti in base ai dati degli utenti e l'elaborazione di conclusioni complesse da grandi quantità di dati.

Lama 4 Maverick

Il Llama 4 Maverick è il più potente dei due modelli disponibili:

  • 17 miliardi di parametri attivi con 128 esperti (400 miliardi di parametri in totale)
  • La versione sperimentale della chat ha raggiunto ELO 1417 su LMArena
  • Secondo Meta, supera modelli come GPT-4o e Gemini 2.0 Flash in numerosi benchmark

Questo modello è particolarmente adatto per applicazioni di assistenza generale e chat, come la scrittura creativa, e mostra risultati paragonabili a DeepSeek v3 in attività di ragionamento e codifica, ma con la metà dei parametri.

Lama 4 Behemoth

Llama 4 Behemoth è il modello più potente di Meta, ma non è ancora disponibile al pubblico:

  • 288 miliardi di parametri attivi con 16 esperti (quasi 2 trilioni di parametri in totale)
  • Secondo Meta, supera GPT-4.5, Claude Sonnet 3.7 e Gemini 2.0 Pro in diversi benchmark STEM
  • Serve come "modello insegnante" per i modelli Llama 4 più piccoli

Behemoth è attualmente ancora in fase di addestramento e verrà rilasciato in un secondo momento.

Innovazioni tecniche

La gamma di modelli Llama 4 introduce diverse innovazioni tecniche significative che ne migliorano le prestazioni e l'efficienza:

Architettura di mix di esperti (MoE)

Una delle innovazioni più importanti di Llama 4 è l'architettura Mixture of Experts (MoE), in cui per ogni token viene attivato solo un sottoinsieme dei parametri del modello:

  • Ciò riduce significativamente lo sforzo di calcolo e la latenza, mantenendo al contempo prestazioni elevate
  • In Llama 4 Maverick, ogni token viene elaborato da un esperto condiviso e da uno dei 128 esperti instradati
  • Questa architettura consente di aumentare i parametri complessivi del modello senza aumentare i costi di inferenza

Multimodalità nativa con fusione precoce

Llama 4 è il primo modello aperto con multimodalità nativa tramite Early Fusion:

  • I token di testo e immagine sono integrati in un'architettura modello unificata
  • Ciò consente una pre-formazione congiunta con grandi quantità di dati di testo, immagini e video
  • A differenza di Llama 3.2, che utilizzava parametri separati per testo e immagini, Llama 4 comprende entrambe le modalità in modo nativo con gli stessi parametri

Finestra di contesto estremamente lunga

La finestra di contesto estremamente lunga di Llama 4 Scout è particolarmente impressionante:

  • Con 10 milioni di token, supera di gran lunga la maggior parte dei modelli disponibili
  • Ciò consente l'elaborazione di documenti molto lunghi, intere basi di codice o conversazioni estese
  • Tutto ciò è possibile grazie all'architettura iRoPE (interleaved attention layers)

Nuovi metodi di allenamento

Meta ha utilizzato diversi metodi innovativi per addestrare Llama 4:

  • MetaP: una tecnica per la messa a punto robusta degli iperparametri critici del modello
  • Precisione FP8: utilizzo di numeri in virgola mobile a 8 bit per un addestramento efficiente
  • Co-distillazione: utilizzo di Llama 4 Behemoth come modello di insegnante per modelli più piccoli
  • Apprendimento online completamente asincrono con amplificazione: una nuova infrastruttura per l'apprendimento su larga scala

Disponibilità e integrazione

I modelli Llama 4 sono disponibili tramite diverse piattaforme e servizi:

Fornitori di download e cloud

  • I modelli Scout e Maverick possono essere scaricati direttamente da Meta o tramite Hugging Face
  • Sono disponibili anche tramite diverse piattaforme cloud:
    • Intelligenza artificiale di Cloudflare Workers
    • Azure AI Foundry e Azure Databricks
    • Vertex AI di Google Cloud
    • Nei prossimi giorni seguiranno altri partner

Integrazione nei meta-prodotti

Meta ha già aggiornato i suoi assistenti AI a Llama 4 su diverse piattaforme:

  • WhatsApp, Messenger e Instagram Direct in 40 paesi diversi
  • Il sito web Meta.AI
  • Tuttavia, le funzionalità multimodali sono attualmente disponibili solo per gli utenti di lingua inglese negli Stati Uniti

Correlato a questo:

Licenze e controversie

Sebbene Meta Llama 4 sia descritto come "open source", la licenza presenta alcune restrizioni che hanno suscitato polemiche:

Restrizioni della licenza

La licenza Llama 4 Community contiene diverse restrizioni:

  • Le aziende con più di 700 milioni di utenti attivi al mese necessitano di una licenza speciale da Meta
  • A quanto pare, agli utenti e alle aziende dell'UE non è consentito utilizzare o distribuire i modelli, presumibilmente a causa di requisiti normativi
  • Esistono requisiti riguardanti la denominazione e l'attribuzione dei modelli derivati

Dibattito sull'”Open Source”

C'è un dibattito se Llama 4 debba effettivamente essere chiamato "Open Source":

  • Nel 2023, l'Open Source Initiative ha stabilito che le restrizioni della licenza Llama la escludono "dalla categoria 'Open Source'"
  • I critici sostengono che si tratta più di un modello "source-open" o "open-weights" che di un vero software open source
  • Le restrizioni in materia di licenze potrebbero rappresentare un problema per le piccole imprese prive di un proprio ufficio legale

Progetti futuri

Meta ha già dato qualche anticipazione sui suoi piani futuri per Llama 4 e oltre:

LlamaCon e altri annunci

  • Meta terrà la sua prima conferenza LlamaCon il 29 aprile 2025, dove verranno annunciati ulteriori dettagli sui suoi modelli di intelligenza artificiale e sui piani di prodotto
  • L'azienda prevede inoltre di rilasciare un'applicazione dedicata per il suo meta chatbot nel secondo trimestre

Ampliare le competenze linguistiche

  • Meta sta lavorando per migliorare le competenze linguistiche di Llama 4 per consentire conversazioni più naturali
  • L'obiettivo è consentire dialoghi bidirezionali più fluidi, in cui gli utenti possano interrompere il modello di intelligenza artificiale
  • Chris Cox, Chief Product Officer di Meta, ha descritto il prossimo Llama 4 come un "omni-modello" che consente di utilizzare la lingua madre anziché tradurre il parlato in testo

IA agentica e capacità avanzate

  • Mark Zuckerberg ha annunciato che Llama 4 avrà "capacità agenti" che consentiranno nuovi casi d'uso
  • Meta si propone di sviluppare modelli di intelligenza artificiale in grado di "eseguire azioni generalizzate, comunicare in modo naturale con gli esseri umani e risolvere problemi complessi"
  • L'azienda sta valutando l'offerta di abbonamenti premium per il suo assistente AI per scopi legati agli agenti, come prenotazioni o produzione video

Perché Llama 4 rappresenta una svolta nel panorama dell'intelligenza artificiale

Il rilascio di Llama 4 rappresenta un passo significativo nella strategia di Meta per diventare leader nel campo altamente competitivo dell'intelligenza artificiale generativa. Con l'introduzione dell'architettura Mixture of Experts, della multimodalità nativa e di una finestra di contesto incredibilmente lunga, Meta dimostra che i modelli aperti possono competere con i modelli proprietari delle principali aziende tecnologiche.

Nonostante le controversie sulle licenze e la questione se Llama 4 possa davvero essere definito "open source", i progressi tecnici rappresentano una pietra miliare significativa. La capacità dei modelli di elaborare sia testo che immagini apre nuove possibilità per sviluppatori e aziende.

Con il Llama 4 Behemoth ancora in fase di sviluppo e i piani annunciati per il potenziamento delle capacità linguistiche e degli agenti, è chiaro che Meta intensificherà ulteriormente i suoi investimenti nell'intelligenza artificiale. I prossimi mesi mostreranno come questi nuovi modelli trasformeranno il panorama dell'intelligenza artificiale e se, come previsto da Mark Zuckerberg, aiuteranno davvero i modelli di intelligenza artificiale aperti a diventare la forza trainante dell'intelligenza artificiale.

Correlato a questo:

 

Il tuo partner globale per il marketing e lo sviluppo aziendale

☑️ La nostra lingua aziendale è l'inglese o il tedesco

☑️ NOVITÀ: Corrispondenza nella tua lingua madre!

 

Konrad Wolfenstein

Io e il mio team saremo lieti di essere a tua disposizione come tuo consulente personale.

Puoi contattarmi compilando il modulo di contatto qui wolfenstein@xpert.digital:o semplicemente chiamandomi al numero +49 7348 4088 965. Il mio indirizzo email è

Non vedo l'ora di iniziare il nostro progetto comune.

 

 

☑️ Supporto alle PMI in strategia, consulenza, pianificazione e implementazione

☑️ Creazione o riallineamento della strategia digitale e digitalizzazione

☑️ Espansione e ottimizzazione dei processi di vendita internazionali

☑️ Piattaforme di trading B2B globali e digitali

☑️ Sviluppo aziendale pionieristico / Marketing / PR / Fiere

Lascia la versione mobile