⭐️ Intelligence Artificielle (IA) - Blog, plateforme et centre de ressources sur l'IA ⭐️ Intelligence Numérique ⭐️ XPaper

Sélection de voix 📢

Meta lance une nouvelle série de modèles d'IA : Llama 4 Scout, Maverick et Behemoth

Publié le : 6 avril 2025 / Mis à jour le : 6 avril 2025 – Auteur : Konrad Wolfenstein

Meta lance sa nouvelle série de modèles IA : Llama 4 Scout, Maverick et Behemoth – Image : Xpert.Digital

Llama 4 : La nouvelle génération de systèmes d’IA ouverts de Meta

Llama 4 révélé : la clé de Meta pour la prochaine ère de l'IA

Le 5 avril 2025, Meta a dévoilé Llama 4, la dernière génération de ses modèles d'IA. Ces nouveaux modèles constituent une avancée majeure dans le développement des systèmes d'IA ouverts et intègrent des fonctionnalités révolutionnaires qui améliorent considérablement leurs performances et leur efficacité. La série Llama 4 comprend plusieurs modèles, dont deux sont déjà accessibles au public, tandis que le modèle le plus puissant est encore en phase d'entraînement.

Convient à:

Des modèles AI simplement expliqués: comprendre les bases de l'IA, les modèles vocaux et le raisonnement

La famille de modèles Llama 4

Meta a développé trois modèles différents dans la série Llama 4, chacun optimisé pour des cas d'utilisation différents :

Llama 4 Scout

Le Llama 4 Scout est un modèle compact doté de spécifications techniques impressionnantes :

17 milliards de paramètres actifs avec 16 experts (soit un total de 109 milliards de paramètres)
Peut fonctionner sur un seul GPU NVIDIA H100 avec quantification Int4
Il dispose d'une fenêtre de contexte remarquablement large de 10 millions de jetons, ce qui en fait l'un des premiers modèles ouverts dotés d'une telle capacité

Selon Meta, Scout surpasse les autres modèles de sa catégorie, tels que Gemini 3, Gemini 2.0 Flash-Lite et Mistral 3.1. Il est particulièrement adapté à des tâches telles que la synthèse de longs documents, la personnalisation du contenu en fonction des données de l'utilisateur et la formulation de conclusions complexes à partir de grandes quantités de connaissances.

Llama 4 Maverick

Le Llama 4 Maverick est le plus puissant des deux modèles disponibles :

17 milliards de paramètres actifs avec 128 experts (400 milliards de paramètres au total)
La version expérimentale avec chat a atteint le niveau ELO 1417 sur LMArena
Selon Meta, il surpasse des modèles comme GPT-4o et Gemini 2.0 Flash dans de nombreux tests de performance

Ce modèle est particulièrement adapté aux applications d'assistance générale et de chat telles que l'écriture créative et affiche des résultats comparables à DeepSeek v3 dans les tâches de raisonnement et de codage, mais avec la moitié des paramètres.

Lama 4 Béhémoth

Llama 4 Behemoth est le modèle le plus puissant de Meta, mais il n'est pas encore disponible au public :

288 milliards de paramètres actifs avec 16 experts (près de 2 billions de paramètres au total)
Selon Meta, il surpasse GPT-4.5, Claude Sonnet 3.7 et Gemini 2.0 Pro dans plusieurs benchmarks STEM
Sert de « modèle pédagogique » pour les modèles Llama 4 plus petits

Behemoth est actuellement encore en phase de développement et sera disponible ultérieurement.

innovations techniques

La gamme Llama 4 introduit plusieurs innovations techniques importantes qui améliorent ses performances et son efficacité :

Architecture mixte d'experts (Ministère de l'Éducation)

L'une des innovations les plus importantes de Llama 4 est l'architecture Mixture of Experts (MoE), dans laquelle seul un sous-ensemble des paramètres du modèle est activé pour chaque jeton :

Cela réduit considérablement l'effort de calcul et la latence, tout en maintenant des performances élevées
Dans Llama 4 Maverick, chaque jeton est traité par un expert partagé et par l'un des 128 experts routés
Cette architecture permet d'augmenter le nombre total de paramètres du modèle sans augmenter les coûts d'inférence

Multimodalité native avec fusion précoce

Llama 4 est le premier modèle ouvert doté d'une multimodalité native grâce à Early Fusion :

Les jetons de texte et d'image sont intégrés dans une architecture de modèle unifiée
Cela permet un pré-entraînement conjoint avec de grandes quantités de données textuelles, d'images et de vidéos
Contrairement à Llama 3.2, qui utilisait des paramètres distincts pour le texte et les images, Llama 4 comprend nativement les deux modalités avec les mêmes paramètres

Fenêtre de contexte extrêmement longue

La fenêtre de contexte extrêmement longue de Llama 4 Scout est particulièrement impressionnante :

Avec 10 millions de jetons, il surpasse largement la plupart des modèles disponibles
Cela permet le traitement de documents très longs, de bases de code complètes ou de conversations approfondies
L'architecture iRoPE (couches d'attention entrelacées) rend cela possible

Nouvelles méthodes de formation

Meta a utilisé plusieurs méthodes innovantes pour entraîner Llama 4 :

MetaP : une technique pour optimiser de manière robuste les hyperparamètres critiques d’un modèle
Précision FP8 : Utilisation de nombres à virgule flottante 8 bits pour un apprentissage efficace
Co-distillation : Utilisation du Lama 4 Behemoth comme modèle pédagogique pour des modèles plus petits
Apprentissage en ligne entièrement asynchrone avec amplification : une nouvelle infrastructure pour l'apprentissage à grande échelle

Disponibilité et intégration

Les modèles Llama 4 sont disponibles via différentes plateformes et services :

Fournisseurs de téléchargement et de cloud

Les modèles Scout et Maverick peuvent être téléchargés directement depuis Meta ou via Hugging Face
Elles sont également disponibles via différentes plateformes cloud :
- IA des travailleurs de Cloudflare
- Azure AI Foundry et Azure Databricks
- Vertex AI de Google Cloud
- D'autres partenaires se joindront à nous dans les prochains jours

Intégration dans les méta-produits

Meta a déjà mis à jour ses assistants IA vers Llama 4 sur différentes plateformes :

WhatsApp, Messenger et Instagram Direct dans 40 pays différents
Le site web Meta.AI
Cependant, les fonctionnalités multimodales ne sont actuellement disponibles que pour les utilisateurs anglophones aux États-Unis

Convient à:

Meta Ai en Allemagne est là! WhatsApp, Instagram et Facebook obtiennent des différences importantes dans la version américaine

Licences et controverses

Bien que Meta Llama 4 soit décrit comme « open source », certaines restrictions de la licence ont suscité la controverse :

Restrictions de licence

La licence communautaire Llama 4 comporte plusieurs restrictions :

Les entreprises comptant plus de 700 millions d'utilisateurs actifs mensuels doivent obtenir une licence spéciale auprès de Meta
Il semblerait que les utilisateurs et les entreprises de l'UE ne soient pas autorisés à utiliser ou à distribuer ces modèles, vraisemblablement en raison d'exigences réglementaires
Il existe des exigences concernant la dénomination et l'attribution des modèles dérivés

Débat autour de l’« Open Source »

La question de savoir si Llama 4 devrait réellement être qualifié de « logiciel libre » fait débat :

L'Open Source Initiative a déterminé en 2023 que les restrictions de la licence Llama la font « sortir de la catégorie "Open Source" »
Les critiques affirment qu'il s'agit davantage d'un modèle « à source ouverte » ou « à pondération ouverte » que d'un véritable logiciel libre
Les restrictions liées aux licences pourraient poser problème aux petites entreprises qui ne disposent pas de leur propre service juridique

Projets futurs

Meta a déjà donné un aperçu de ses projets futurs pour Llama 4 et les opus suivants :

LlamaCon et autres annonces

Meta organisera sa première conférence LlamaCon le 29 avril 2025, au cours de laquelle de plus amples détails sur ses modèles d'IA et ses projets de produits seront annoncés
L'entreprise prévoit également de lancer une application dédiée à son méta-chatbot au cours du deuxième trimestre

Développer ses compétences linguistiques

Meta travaille à améliorer les compétences linguistiques de Llama 4 afin de permettre des conversations plus naturelles
L’objectif est de permettre des dialogues bidirectionnels plus fluides où les utilisateurs peuvent interrompre le modèle d’IA
Chris Cox, directeur des produits chez Meta, a décrit le futur Llama 4 comme un « modèle omni » qui permet d'utiliser la langue maternelle au lieu de traduire la parole en texte

IA agentielle et capacités améliorées

Mark Zuckerberg a annoncé que Llama 4 disposera de « capacités d'agent » qui permettront de nouveaux cas d'utilisation
Meta vise à développer des modèles d'IA capables d'« effectuer des actions généralisées, de communiquer naturellement avec les humains et de résoudre des problèmes complexes »
L'entreprise envisage de proposer des abonnements premium pour son assistant IA à des fins liées aux agents, telles que les réservations ou la production vidéo

Pourquoi Llama 4 représente un tournant dans le paysage de l'IA

La sortie de Llama 4 représente une étape importante dans la stratégie de Meta visant à devenir un leader du secteur très concurrentiel de l'IA générative. Grâce à l'introduction de l'architecture Mixture of Experts, de la multimodalité native et d'une fenêtre de contexte exceptionnellement longue, Meta démontre que les modèles ouverts peuvent rivaliser avec les modèles propriétaires des grandes entreprises technologiques.

Malgré les controverses liées à la licence et à la question de savoir si Llama 4 devrait véritablement être qualifié de « logiciel libre », ses avancées techniques constituent une étape importante. La capacité des modèles à traiter à la fois le texte et les images ouvre de nouvelles perspectives aux développeurs et aux entreprises.

Avec le projet Llama 4 Behemoth toujours en attente et les plans annoncés pour l'amélioration des capacités linguistiques et des agents, il est clair que Meta va intensifier ses investissements dans l'IA. Les prochains mois nous diront comment ces nouveaux modèles transformeront le paysage de l'IA et s'ils permettront effectivement, comme l'a prédit Mark Zuckerberg, aux modèles d'IA ouverte de devenir la force motrice de l'intelligence artificielle.

Convient à: