Sélection de voix 📢


Meta publie New Llama 4 Scout, Maverick et Behemoth

Publié le: 6 avril 2025 / mise à jour du: 6 avril 2025 - Auteur: Konrad Wolfenstein

Meta publie New Llama 4 Scout, Maverick et Behemoth

Meta publie New Llama 4 Scout, Maverick et Behemoth-Image: Xpert.Digital

LLAMA 4: La nouvelle génération de systèmes d'IA ouverts à partir de Meta

LLAMA 4 REVELED: Metas Key à l'âge de l'IA suivant

Meta a présenté la dernière génération de ses modèles d'IA, Llama 4, le 5 avril 2025. Ces nouveaux modèles représentent des progrès significatifs dans le développement de systèmes d'IA ouverts et ont un certain nombre de fonctions révolutionnaires qui augmentent considérablement leurs performances et leur efficacité. La LLAMA 4 Series se compose de modèles différents, dont deux déjà accessibles au public, tandis que le modèle le plus puissant est toujours en phase de formation.

Convient à:

La famille modèle Llama 4

Meta a développé trois modèles différents dans la série LLAMA 4, dont chacun est optimisé pour différentes applications:

Llama 4 Scout

Llama 4 Scout est un modèle compact avec des spécifications techniques impressionnantes:

  • 17 milliards de paramètres actifs avec 16 experts (un total de 109 milliards de paramètres)
  • Peut être exploité sur un seul GPU NVIDIA H100 avec quantification INT4
  • A une fenêtre de contexte remarquablement grande de 10 millions de jetons, ce qui en fait l'un des premiers modèles ouverts avec cette capacité

Selon Meta, Scout dépasse d'autres modèles de sa classe comme Gemini 3, Gemini 2.0 Flash-Lite et Mistral 3.1. Il convient particulièrement aux tâches telles que le résumé des documents longs, la personnalisation basée sur les données des utilisateurs et les conclusions complexes sur les grandes quantités de connaissances.

Llama 4 Maverick

Llama 4 Maverick est le plus puissant des deux modèles disponibles:

  • 17 milliards de paramètres actifs avec 128 experts (un total de 400 milliards de paramètres)
  • La version expérimentale de chat a atteint Elo 1417 sur Lmarena
  • Dépasse des modèles tels que GPT-4O et Gemini 2.0 Flash dans de nombreux repères

Ce modèle est particulièrement adapté aux applications générales d'assistance et de chat telles que l'écriture créative et montre des résultats comparables à Deepseek V3 dans les tâches de raisonnement et de codage, mais avec la moitié des paramètres.

Llama 4 Behemoth

Le géant de Llama 4 est le modèle le plus puissant de Metas, qui n'est pas encore accessible au public:

  • 288 milliards de paramètres actifs avec 16 experts (un total de près de 2 billions de paramètres)
  • Selon Meta, il dépasse GPT-4.5, Claude Sonnet 3.7 et Gemini 2.0 Pro pour plusieurs repères STEM
  • Sert de «modèle d'enseignant» pour les modèles plus petits Llama 4

Behemoth est actuellement toujours en phase de formation et sera publié à une date ultérieure.

Innovations techniques

La série de modèles LLAMA 4 introduit plusieurs innovations techniques importantes qui améliorent leurs performances et leur efficacité:

Mélange d'experts (MOE) Architecture

L'une des innovations les plus importantes chez Llama 4 est l'architecture du mélange d'experts (MOE), dans laquelle seule une partie des paramètres du modèle est activée pour chaque jeton:

  • Cela réduit considérablement l'effort de calcul et la latence, tandis que les performances élevées sont préservées
  • Chez Llama 4 Maverick, chaque jeton est traité par un expert commun et l'un des 128 experts gérisés
  • Cette architecture permet d'augmenter le paramètre total du modèle sans augmenter les coûts d'inférence

Multimodalité native avec fusion précoce

Llama 4 est le premier modèle ouvert avec la multimodalité native par la fusion précoce:

  • Les jetons de texte et d'image sont intégrés dans une architecture de modèle uniforme
  • Cela permet une formation préliminaire conjointe avec de grandes quantités de données de texte, d'image et de vidéo
  • Contrairement à Llama 3.2, qui a utilisé des paramètres séparés pour le texte et les images, Llama 4 comprend les deux modalités natives avec les mêmes paramètres

Fenêtre de contexte extrêmement long

La fenêtre de contexte extrêmement long de Llama 4 Scout est particulièrement impressionnante:

  • Avec 10 millions de jetons, il dépasse clairement la plupart des modèles disponibles
  • Cela permet le traitement de très longs documents, de bases de code entières ou de conversations étendues
  • L'architecture Irope (couches d'attention entrelacées) rend cela possible

Nouvelles méthodes de formation

Meta a utilisé plusieurs méthodes innovantes pour la formation de Llama 4:

  • Metap: une technique pour la coordination robuste de l'hyperamètre de modèle critique
  • FP8 PRÉCISION: Utilisation de numéros de diapositive 8 bits pour une formation efficace
  • CO-DISTILLATION: UTILISATION DE LAMA 4 ACHEMOTH comme modèle d'enseignant pour les modèles plus petits
  • Apprentissage en ligne entièrement asynchrone avec renforts: une nouvelle infrastructure pour l'apprentissage à grande échelle

Disponibilité et intégration

Les modèles LLAMA 4 sont disponibles via diverses plateformes et services:

Téléchargement et fournisseur de cloud

  • Les modèles Scout et Maverick peuvent être téléchargés directement à partir de Meta ou via un visage étreint
  • Ils sont également disponibles via diverses plates-formes cloud:
    • Cloudflare Workers AI
    • Azure AI Foundry et Azure Databricks
    • Vertex de Google Cloud
    • D'autres partenaires suivront dans les prochains jours

Intégration dans les méta-produits

Meta a déjà mis à jour ses assistants en IA sur diverses plateformes de Llama 4:

  • WhatsApp, Messenger et Instagram directs dans 40 pays différents
  • Le site Meta.ai
  • Cependant, les fonctions multimodales ne sont actuellement disponibles que pour les utilisateurs de la langue anglaise aux États-Unis

Convient à:

Licence et controverse

Bien que Meta Llama 4 se réfère à «l'open source», il y a certaines restrictions dans la licence qui a déclenché la controverse:

Restrictions de licence

La licence communautaire de Llama 4 contient plusieurs restrictions:

  • Les entreprises avec plus de 700 millions d'utilisateurs actifs mensuels ont besoin d'une licence spéciale de Meta
  • Les modèles ne sont apparemment pas autorisés à utiliser ou à distribuer des utilisateurs et des entreprises de l'UE, probablement en raison des exigences réglementaires
  • Il existe des exigences concernant la dénomination et l'attribution pour les modèles dérivés

Débat sur «open source»

Il y a un débat sur la question de savoir si Llama 4 devrait en fait être appelé «open source»:

  • L'initiative open source a constaté en 2023 que les restrictions de la licence de lama le retirent «de la catégorie« open source »»
  • Les critiques soutiennent qu'il s'agit davantage d'un modèle «source-ouverte» ou «avec des poids ouverts» que le logiciel open source réel
  • Les restrictions de licence pourraient être problématiques pour les petites entreprises sans leurs propres services juridiques

Plans futurs

Meta a déjà donné un aperçu de ses plans futurs pour Llama 4 et au-delà:

Llamacon et autres annonces

  • Meta organisera la première conférence Llamacon le 29 avril 2025, dans laquelle de plus amples détails sur ses modèles d'IA et ses plans de produits doivent être annoncés
  • La société prévoit également de publier une demande dédiée à son bot méta-chat au deuxième trimestre

Expansion des compétences linguistiques

  • Meta travaille à l'amélioration des compétences linguistiques de Llama 4 pour permettre des conversations plus naturelles
  • L'objectif est de permettre des dialogues plus fluides et bilatéraux dans lesquels les utilisateurs peuvent interrompre le modèle d'IA
  • Chris Cox, chef de produit de Meta, a décrit le prochain Llama 4 comme un «modèle omni» qui permet la langue maternelle au lieu de traduire la langue en texte

AI agentique et compétences étendues

  • Mark Zuckerberg a annoncé que Llama 4 aura des «compétences d'agent» qui devraient permettre de nouvelles applications
  • Meta vise à développer des modèles d'IA qui «effectuent des actions généralisées, bien sûr communiquer avec les gens et résoudre des problèmes difficiles»
  • La société envisage d'offrir des abonnements premium à son assistant AI à des fins d'agent telles que les réservations ou la production vidéo

Pourquoi Llama 4 est un tournant dans le paysage de l'IA

La publication de Llama 4 représente une étape importante dans la stratégie Metas pour devenir le principal domaine de l'IA générative dans le domaine hautement compétitif. Avec l'introduction du mélange d'architecture d'experts, de multimodalité native et d'une fenêtre de contexte impressionnant, Meta montre que les modèles ouverts peuvent suivre les modèles propriétaires des grandes entreprises technologiques.

Malgré la controverse sur la licence et la question de savoir si Llama 4 devrait vraiment être appelé «open source», le progrès technique est une étape importante. La capacité des modèles à traiter à la fois du texte et des images ouvre de nouvelles opportunités pour les développeurs et les entreprises.

Avec le géant du Llama 4 exceptionnel et les plans annoncés pour les compétences élargies du langage et des agents, il est clair que Meta intensifiera encore ses investissements dans l'IA. Les mois à venir montreront comment ces nouveaux modèles changent le paysage de l'IA et si, comme prévu par Mark Zuckerberg, ils aideront en fait à faire des modèles d'IA ouverts dans le domaine de l'intelligence artificielle.

Convient à:

 

Votre partenaire mondial de marketing et de développement commercial

☑️ Notre langue commerciale est l'anglais ou l'allemand

☑️ NOUVEAU : Correspondance dans votre langue nationale !

 

Pionnier du numérique - Konrad Wolfenstein

Konrad Wolfenstein

Je serais heureux de vous servir, vous et mon équipe, en tant que conseiller personnel.

Vous pouvez me contacter en remplissant le formulaire de contact ou simplement m'appeler au +49 89 89 674 804 (Munich) . Mon adresse e-mail est : wolfenstein xpert.digital

J'attends avec impatience notre projet commun.

 

 

☑️ Accompagnement des PME en stratégie, conseil, planification et mise en œuvre

☑️ Création ou réalignement de la stratégie digitale et digitalisation

☑️ Expansion et optimisation des processus de vente à l'international

☑️ Plateformes de trading B2B mondiales et numériques

☑️ Pionnier Développement Commercial / Marketing / RP / Salons


⭐️ Intelligence artificielle (AI) -ai blog, hotspot et hub de contenu ⭐️ Intelligence numérique ⭐️ Xpaper