
Meta lance sa nouvelle série de modèles IA : Llama 4 Scout, Maverick et Behemoth – Image : Xpert.Digital
Llama 4 : La nouvelle génération de systèmes d’IA ouverts de Meta
Llama 4 révélé : la clé de Meta pour la prochaine ère de l'IA
Le 5 avril 2025, Meta a dévoilé Llama 4, la dernière génération de ses modèles d'IA. Ces nouveaux modèles constituent une avancée majeure dans le développement des systèmes d'IA ouverts et intègrent des fonctionnalités révolutionnaires qui améliorent considérablement leurs performances et leur efficacité. La série Llama 4 comprend plusieurs modèles, dont deux sont déjà accessibles au public, tandis que le modèle le plus puissant est encore en phase d'entraînement.
Convient à:
- Des modèles AI simplement expliqués: comprendre les bases de l'IA, les modèles vocaux et le raisonnement
La famille de modèles Llama 4
Meta a développé trois modèles différents dans la série Llama 4, chacun optimisé pour des cas d'utilisation différents :
Llama 4 Scout
Le Llama 4 Scout est un modèle compact doté de spécifications techniques impressionnantes :
- 17 milliards de paramètres actifs avec 16 experts (soit un total de 109 milliards de paramètres)
- Peut fonctionner sur un seul GPU NVIDIA H100 avec quantification Int4
- Il dispose d'une fenêtre de contexte remarquablement large de 10 millions de jetons, ce qui en fait l'un des premiers modèles ouverts dotés d'une telle capacité
Selon Meta, Scout surpasse les autres modèles de sa catégorie, tels que Gemini 3, Gemini 2.0 Flash-Lite et Mistral 3.1. Il est particulièrement adapté à des tâches telles que la synthèse de longs documents, la personnalisation du contenu en fonction des données de l'utilisateur et la formulation de conclusions complexes à partir de grandes quantités de connaissances.
Llama 4 Maverick
Le Llama 4 Maverick est le plus puissant des deux modèles disponibles :
- 17 milliards de paramètres actifs avec 128 experts (400 milliards de paramètres au total)
- La version expérimentale avec chat a atteint le niveau ELO 1417 sur LMArena
- Selon Meta, il surpasse des modèles comme GPT-4o et Gemini 2.0 Flash dans de nombreux tests de performance
Ce modèle est particulièrement adapté aux applications d'assistance générale et de chat telles que l'écriture créative et affiche des résultats comparables à DeepSeek v3 dans les tâches de raisonnement et de codage, mais avec la moitié des paramètres.
Lama 4 Béhémoth
Llama 4 Behemoth est le modèle le plus puissant de Meta, mais il n'est pas encore disponible au public :
- 288 milliards de paramètres actifs avec 16 experts (près de 2 billions de paramètres au total)
- Selon Meta, il surpasse GPT-4.5, Claude Sonnet 3.7 et Gemini 2.0 Pro dans plusieurs benchmarks STEM
- Sert de « modèle pédagogique » pour les modèles Llama 4 plus petits
Behemoth est actuellement encore en phase de développement et sera disponible ultérieurement.
innovations techniques
La gamme Llama 4 introduit plusieurs innovations techniques importantes qui améliorent ses performances et son efficacité :
Architecture mixte d'experts (Ministère de l'Éducation)
L'une des innovations les plus importantes de Llama 4 est l'architecture Mixture of Experts (MoE), dans laquelle seul un sous-ensemble des paramètres du modèle est activé pour chaque jeton :
- Cela réduit considérablement l'effort de calcul et la latence, tout en maintenant des performances élevées
- Dans Llama 4 Maverick, chaque jeton est traité par un expert partagé et par l'un des 128 experts routés
- Cette architecture permet d'augmenter le nombre total de paramètres du modèle sans augmenter les coûts d'inférence
Multimodalité native avec fusion précoce
Llama 4 est le premier modèle ouvert doté d'une multimodalité native grâce à Early Fusion :
- Les jetons de texte et d'image sont intégrés dans une architecture de modèle unifiée
- Cela permet un pré-entraînement conjoint avec de grandes quantités de données textuelles, d'images et de vidéos
- Contrairement à Llama 3.2, qui utilisait des paramètres distincts pour le texte et les images, Llama 4 comprend nativement les deux modalités avec les mêmes paramètres
Fenêtre de contexte extrêmement longue
La fenêtre de contexte extrêmement longue de Llama 4 Scout est particulièrement impressionnante :
- Avec 10 millions de jetons, il surpasse largement la plupart des modèles disponibles
- Cela permet le traitement de documents très longs, de bases de code complètes ou de conversations approfondies
- L'architecture iRoPE (couches d'attention entrelacées) rend cela possible
Nouvelles méthodes de formation
Meta a utilisé plusieurs méthodes innovantes pour entraîner Llama 4 :
- MetaP : une technique pour optimiser de manière robuste les hyperparamètres critiques d’un modèle
- Précision FP8 : Utilisation de nombres à virgule flottante 8 bits pour un apprentissage efficace
- Co-distillation : Utilisation du Lama 4 Behemoth comme modèle pédagogique pour des modèles plus petits
- Apprentissage en ligne entièrement asynchrone avec amplification : une nouvelle infrastructure pour l'apprentissage à grande échelle
Disponibilité et intégration
Les modèles Llama 4 sont disponibles via différentes plateformes et services :
Fournisseurs de téléchargement et de cloud
- Les modèles Scout et Maverick peuvent être téléchargés directement depuis Meta ou via Hugging Face
- Elles sont également disponibles via différentes plateformes cloud :
- IA des travailleurs de Cloudflare
- Azure AI Foundry et Azure Databricks
- Vertex AI de Google Cloud
- D'autres partenaires se joindront à nous dans les prochains jours
Intégration dans les méta-produits
Meta a déjà mis à jour ses assistants IA vers Llama 4 sur différentes plateformes :
- WhatsApp, Messenger et Instagram Direct dans 40 pays différents
- Le site web Meta.AI
- Cependant, les fonctionnalités multimodales ne sont actuellement disponibles que pour les utilisateurs anglophones aux États-Unis
Convient à:
- Meta Ai en Allemagne est là! WhatsApp, Instagram et Facebook obtiennent des différences importantes dans la version américaine
Licences et controverses
Bien que Meta Llama 4 soit décrit comme « open source », certaines restrictions de la licence ont suscité la controverse :
Restrictions de licence
La licence communautaire Llama 4 comporte plusieurs restrictions :
- Les entreprises comptant plus de 700 millions d'utilisateurs actifs mensuels doivent obtenir une licence spéciale auprès de Meta
- Il semblerait que les utilisateurs et les entreprises de l'UE ne soient pas autorisés à utiliser ou à distribuer ces modèles, vraisemblablement en raison d'exigences réglementaires
- Il existe des exigences concernant la dénomination et l'attribution des modèles dérivés
Débat autour de l’« Open Source »
La question de savoir si Llama 4 devrait réellement être qualifié de « logiciel libre » fait débat :
- L'Open Source Initiative a déterminé en 2023 que les restrictions de la licence Llama la font « sortir de la catégorie "Open Source" »
- Les critiques affirment qu'il s'agit davantage d'un modèle « à source ouverte » ou « à pondération ouverte » que d'un véritable logiciel libre
- Les restrictions liées aux licences pourraient poser problème aux petites entreprises qui ne disposent pas de leur propre service juridique
Projets futurs
Meta a déjà donné un aperçu de ses projets futurs pour Llama 4 et les opus suivants :
LlamaCon et autres annonces
- Meta organisera sa première conférence LlamaCon le 29 avril 2025, au cours de laquelle de plus amples détails sur ses modèles d'IA et ses projets de produits seront annoncés
- L'entreprise prévoit également de lancer une application dédiée à son méta-chatbot au cours du deuxième trimestre
Développer ses compétences linguistiques
- Meta travaille à améliorer les compétences linguistiques de Llama 4 afin de permettre des conversations plus naturelles
- L’objectif est de permettre des dialogues bidirectionnels plus fluides où les utilisateurs peuvent interrompre le modèle d’IA
- Chris Cox, directeur des produits chez Meta, a décrit le futur Llama 4 comme un « modèle omni » qui permet d'utiliser la langue maternelle au lieu de traduire la parole en texte
IA agentielle et capacités améliorées
- Mark Zuckerberg a annoncé que Llama 4 disposera de « capacités d'agent » qui permettront de nouveaux cas d'utilisation
- Meta vise à développer des modèles d'IA capables d'« effectuer des actions généralisées, de communiquer naturellement avec les humains et de résoudre des problèmes complexes »
- L'entreprise envisage de proposer des abonnements premium pour son assistant IA à des fins liées aux agents, telles que les réservations ou la production vidéo
Pourquoi Llama 4 représente un tournant dans le paysage de l'IA
La sortie de Llama 4 représente une étape importante dans la stratégie de Meta visant à devenir un leader du secteur très concurrentiel de l'IA générative. Grâce à l'introduction de l'architecture Mixture of Experts, de la multimodalité native et d'une fenêtre de contexte exceptionnellement longue, Meta démontre que les modèles ouverts peuvent rivaliser avec les modèles propriétaires des grandes entreprises technologiques.
Malgré les controverses liées à la licence et à la question de savoir si Llama 4 devrait véritablement être qualifié de « logiciel libre », ses avancées techniques constituent une étape importante. La capacité des modèles à traiter à la fois le texte et les images ouvre de nouvelles perspectives aux développeurs et aux entreprises.
Avec le projet Llama 4 Behemoth toujours en attente et les plans annoncés pour l'amélioration des capacités linguistiques et des agents, il est clair que Meta va intensifier ses investissements dans l'IA. Les prochains mois nous diront comment ces nouveaux modèles transformeront le paysage de l'IA et s'ils permettront effectivement, comme l'a prédit Mark Zuckerberg, aux modèles d'IA ouverte de devenir la force motrice de l'intelligence artificielle.
Convient à:
Votre partenaire mondial de marketing et de développement commercial
☑️ Notre langue commerciale est l'anglais ou l'allemand
☑️ NOUVEAU : Correspondance dans votre langue nationale !
Je serais heureux de vous servir, vous et mon équipe, en tant que conseiller personnel.
Vous pouvez me contacter en remplissant le formulaire de contact ou simplement m'appeler au +49 89 89 674 804 (Munich) . Mon adresse e-mail est : wolfenstein ∂ xpert.digital
J'attends avec impatience notre projet commun.

