
DeepSeek-R1-0528 : La mise à jour DeepSeek permet au modèle d’IA chinois de rivaliser à nouveau avec les leaders occidentaux du secteur – Image : Xpert.Digital
L'intelligence artificielle open source à ses limites : DeepSeek surpasse OpenAI et Google
De la 60e à la 68e place : DeepSeek propulse l’IA chinoise au sommet
La startup chinoise d'IA DeepSeek a franchi une étape importante avec la publication de DeepSeek-R1-0528 le 28 mai 2025, redéfinissant ainsi le paysage mondial de l'IA. Cette mise à jour du modèle de raisonnement open source affiche des gains de performance spectaculaires, plaçant DeepSeek au même niveau que les modèles o3 d'OpenAI et Gemini 2.5 Pro de Google pour la première fois. Il est particulièrement remarquable que ces performances optimales soient obtenues à un coût bien inférieur et avec des pondérations de modèle entièrement ouvertes, soulevant des questions fondamentales quant à l'avenir des systèmes d'IA propriétaires. La plateforme d'évaluation indépendante Artificial Analysis a attribué la note de 68 points au nouveau modèle – une progression de 60 à 68 points, correspondant à l'écart de performance entre les modèles o1 et o3 d'OpenAI.
En lien avec ceci :
- DeepSeek et Alibaba : une percée au niveau des spécialistes ? L’offensive chinoise en matière d’IA dans le secteur de la santé
La mise à jour et ses améliorations techniques
DeepSeek-R1-0528 représente une amélioration substantielle qui permet d'obtenir des gains de performance significatifs grâce à des optimisations algorithmiques et à une utilisation accrue des ressources de calcul après l'entraînement, sans modifier l'architecture sous-jacente. Cette mise à jour se concentre principalement sur l'amélioration des capacités de raisonnement, permettant, selon DeepSeek, des « processus de pensée nettement plus approfondis ». Un exemple particulièrement impressionnant de cette amélioration est visible lors du test de mathématiques AIME 2025, où la précision est passée de 70 % à 87,5 %. Parallèlement, le nombre moyen de jetons par question est passé de 12 000 à 23 000, témoignant d'un traitement plus intensif.
Outre des améliorations du raisonnement, cette mise à jour introduit d'importantes nouveautés, notamment la sortie JSON et les appels de fonctions, une interface utilisateur optimisée et une réduction des hallucinations. Ces améliorations rendent le modèle beaucoup plus pratique pour les développeurs et étendent considérablement son champ d'application. La disponibilité reste inchangée : les utilisateurs actuels de l'API recevront la mise à jour automatiquement, tandis que les poids du modèle resteront disponibles sous licence MIT ouverte sur Hugging Face.
Performances de référence et comparaisons de performances
Les résultats des tests de performance de DeepSeek-R1-0528 révèlent des améliorations impressionnantes dans toutes les catégories d'évaluation. Pour les tâches mathématiques, le score AIME-2024 est passé de 79,8 % à 91,4 %, le score HMMT-2025 de 41,7 % à 79,4 % et le score CNMO-2024 de 78,8 % à 86,9 %. Ces résultats positionnent ce modèle comme l'un des systèmes d'IA les plus performants au monde pour la résolution de problèmes mathématiques.
DeepSeek-R1-0528 affiche également des progrès significatifs dans les tests de performance en programmation. Son score sur LiveCodeBench est passé de 63,5 % à 73,3 %, sur Aider-Polyglot de 53,3 % à 71,6 % et sur SWE Verified de 49,2 % à 57,6 %. Son score sur Codeforces a progressé de 1 530 à 1 930 points, plaçant ainsi le modèle parmi les meilleurs solveurs algorithmiques. Comparé aux modèles concurrents, DeepSeek-R1 atteint 49,2 % sur SWE Verified, devançant de peu OpenAI o1-1217 (48,9 %). Sur Codeforces, avec un score de 96,3 percentiles et un score Elo de 2 029 points, il se rapproche considérablement du modèle de référence d'OpenAI.
Les tests de culture générale et de logique confirment l'amélioration générale des performances : le score de GPQA-Diamond est passé de 71,5 % à 81,0 %, celui de Humanity's Last Exam de 8,5 % à 17,7 %, celui de MMLU-Pro de 84,0 % à 85,0 % et celui de MMLU-Redux de 92,9 % à 93,4 %. Seul le test SimpleQA d'OpenAI a légèrement reculé, passant de 30,1 % à 27,8 %. Ces améliorations globales démontrent que DeepSeek-R1-0528 est compétitif non seulement dans des domaines spécialisés, mais aussi sur l'ensemble du spectre des tâches cognitives.
Architecture technique et innovations
L'architecture technique de DeepSeek-R1-0528 repose sur un modèle MoE (Mixture of Experts) sophistiqué, intégrant 37 milliards de paramètres actifs sur un total de 671 milliards et un contexte de 128 000 tokens. Ce modèle met en œuvre un apprentissage par renforcement avancé lui permettant d'atteindre l'auto-vérification, la réflexion multi-étapes et des capacités de raisonnement similaires à celles de l'humain. Cette architecture lui permet de traiter des tâches de raisonnement complexes grâce à des processus de pensée itératifs, ce qui le distingue des modèles de langage traditionnels.
Un aspect particulièrement novateur réside dans le développement d'une variante allégée, DeepSeek-R1-0528-Qwen3-8B, obtenue en distillant le processus de réflexion de DeepSeek-R1-0528 pour le post-entraînement de Qwen3-8B-Base. Cette version plus compacte offre des performances impressionnantes avec des besoins en ressources considérablement réduits et fonctionne sur des GPU dotés de 8 à 12 Go de VRAM. Lors du test AIME 2024, le modèle a atteint des performances de pointe parmi les modèles open source, avec une amélioration de 10 % par rapport à Qwen3-8B et des performances comparables à celles de Qwen3-235B-Thinking.
La méthodologie de développement montre que DeepSeek s'appuie de plus en plus sur l'apprentissage par renforcement après l'entraînement, ce qui a entraîné une augmentation de 40 % de la consommation de jetons lors de l'évaluation (de 71 à 99 millions de jetons). Cela suggère que le modèle génère des réponses plus longues et plus approfondies sans nécessiter de modifications architecturales fondamentales.
Position sur le marché et dynamique concurrentielle
DeepSeek-R1-0528 s'impose comme un concurrent sérieux face aux modèles propriétaires de pointe des entreprises technologiques occidentales. Selon Artificial Analysis, ce modèle obtient un score de 68 points, le plaçant au même niveau que Gemini 2.5 Pro de Google et devant des modèles tels que Grok 3 mini de xAI, Llama 4 Maverick de Meta et Nemotron Ultra de Nvidia. En termes de code, DeepSeek-R1-0528 se situe juste en dessous des modèles o4-mini et o3 d'OpenAI.
La publication de cette mise à jour a eu un impact considérable sur le paysage mondial de l'IA. La sortie initiale de DeepSeek-R1 en janvier 2025 avait déjà entraîné une chute des cours des actions technologiques hors de Chine et remis en question l'idée reçue selon laquelle le déploiement de l'IA à grande échelle exige une puissance de calcul et des investissements colossaux. Les concurrents occidentaux ont réagi rapidement : Google a proposé des tarifs d'accès réduits pour Gemini, tandis qu'OpenAI a baissé ses prix et lancé un modèle o3 Mini moins gourmand en ressources de calcul.
Il est intéressant de noter que les analyses de style textuel d'EQBench montrent que le style de DeepSeek-R1 est davantage influencé par Google que par OpenAI, ce qui suggère une utilisation plus importante des données synthétiques de Gemini lors de son développement. Cette observation souligne la complexité des influences et des transferts technologiques entre les différents développeurs d'IA.
rentabilité et disponibilité
L'un des principaux atouts concurrentiels de DeepSeek-R1-0528 réside dans son rapport coût-efficacité exceptionnel. Sa structure tarifaire est nettement plus avantageuse que celle d'OpenAI : les jetons d'entrée coûtent 0,14 $ par million de jetons en cas de succès dans le cache et 0,55 $ en cas d'échec, tandis que les jetons de sortie coûtent 2,19 $ par million de jetons. À titre de comparaison, OpenAI facture 15 $ par million de jetons d'entrée et 60 $ par million de jetons de sortie, ce qui rend DeepSeek-R1 90 à 95 % moins cher.
Microsoft Azure propose également DeepSeek-R1 à des prix compétitifs : la version globale coûte 0,00135 $ par tranche de 1 000 jetons d’entrée et 0,0054 $ par tranche de 1 000 jetons de sortie, tandis que la version régionale est légèrement plus chère. Cette tarification rend ce modèle particulièrement attractif pour les entreprises et les développeurs souhaitant exploiter des fonctionnalités d’IA performantes sans les coûts élevés des solutions propriétaires.
Sa disponibilité en tant que modèle open source sous licence MIT permet également son utilisation commerciale et sa modification sans frais de licence. Les développeurs peuvent exécuter le modèle localement ou l'utiliser via différentes API, ce qui offre flexibilité et contrôle sur l'implémentation. Pour les utilisateurs disposant de ressources limitées, une version allégée de 8 milliards de paramètres est disponible ; elle fonctionne sur du matériel grand public doté de 24 Go de mémoire.
En lien avec ceci :
- Le rattrapage de la Chine en intelligence artificielle : le cas DeepSeek et l'utilisation stratégique des données
Le rattrapage de la Chine en IA : que signifie le succès de DeepSeek ?
DeepSeek-R1-0528 marque un tournant dans le développement mondial de l'IA, démontrant que les entreprises chinoises peuvent concevoir des modèles capables de rivaliser avec les meilleurs systèmes occidentaux malgré les restrictions américaines à l'exportation. Cette mise à jour prouve que des gains de performance significatifs sont possibles sans modifications architecturales fondamentales grâce à une utilisation efficace des optimisations post-entraînement et de l'apprentissage par renforcement. L'alliance de performances optimales, de coûts considérablement réduits et de la disponibilité en open source remet fondamentalement en question les modèles économiques établis dans le secteur de l'IA.
Les réactions des concurrents occidentaux au succès de DeepSeek se traduisent déjà par des changements initiaux sur le marché : baisses de prix chez OpenAI et Google, et développement de modèles plus économes en ressources. Avec la sortie prochaine de DeepSeek-R2, initialement prévue pour mai 2025, cette pression concurrentielle pourrait s’intensifier. Le succès de DeepSeek-R1-0528 démontre que l’innovation en IA ne nécessite pas forcément des investissements massifs ni d’importantes ressources de calcul, mais peut être obtenue grâce à des algorithmes ingénieux et des méthodes de développement efficaces.
En lien avec ceci :
Votre expert en transformation IA, intégration IA et plateformes IA
☑️ Notre langue de travail est l'anglais ou l'allemand
☑️ NOUVEAU : Correspondance dans votre langue maternelle !
Mon équipe et moi-même sommes heureux de pouvoir vous accompagner en tant que conseiller personnel.
Vous pouvez me contacter en remplissant le formulaire de contact ici wolfenstein@xpert.digital :ou simplement m'appeler au +49 7348 4088 965. Mon adresse e-mail est
J'attends avec impatience notre projet commun.

