Chine et DeepSeek | Intelligence artificielle : comment une nouvelle architecture bouleverse le marché des puces

Konrad Wolfenstein

il y a 5 mois

Chine et DeepSeek | Intelligence artificielle : des milliards d’investissements inutiles ? Comment une nouvelle architecture bouleverse le marché des puces – Image : Xpert.Digital

L’effet boomerang : comment les sanctions américaines ont permis la percée chinoise en matière d’IA

294 000 $ au lieu de 100 millions : la vérité sur la guerre des prix chez DeepSeek

La dernière innovation de la société chinoise d'IA DeepSeek soulève des questions fondamentales sur l'avenir de l'intelligence artificielle. Fin décembre 2025, l'entreprise a présenté une nouvelle méthode d'entraînement (appelée Manifold-Constrained Hyper-Connections) susceptible de bouleverser l'ensemble du secteur. Alors que les géants technologiques occidentaux investissent des centaines de milliards de dollars dans d'immenses centres de données et des puces spécialisées, DeepSeek propose une approche alternative fondée sur la sophistication architecturale plutôt que sur de simples investissements de capitaux. Cette avancée pourrait ébranler les fondements économiques de l'industrie de l'IA et inaugurer une transformation où le succès ou l'échec ne dépendra plus de la simple disponibilité des ressources, mais de l'expertise en ingénierie.

L'approche chinoise n'était pas le fruit d'un choix, mais d'une nécessité. Les restrictions à l'exportation imposées par les États-Unis empêchaient les entreprises chinoises d'accéder aux puces d'IA les plus performantes de Nvidia. Ce qui apparaissait initialement comme un désavantage stratégique s'est transformé en un accélérateur de développement. DeepSeek a dû optimiser les performances avec un matériel limité, créant ainsi des méthodes qui remettent aujourd'hui en question la structure des coûts de l'ensemble du secteur. La sortie, en janvier 2025, du modèle R1, rivalisant avec les modèles américains haut de gamme pour un coût bien moindre, a provoqué un véritable séisme sur les marchés boursiers et contraint les analystes du monde entier à revoir leurs modèles d'évaluation.

En lien avec ceci :

DeepSeek V3.2 : Un concurrent de taille pour GPT-5 et Gemini-3, déployable localement sur vos propres systèmes ! La fin des datacenters IA gigabit ?

Des hyperconnexions à la stabilité mathématique

Le fondement technique de la nouvelle méthode DeepSeek repose sur le développement des réseaux au sein de l'IA. Les réseaux neuronaux traditionnels utilisent des connexions résiduelles, sortes de « raccourcis » permettant la transmission d'informations entre les couches du réseau. Ces connexions permettent d'entraîner des réseaux plus profonds en évitant la perte des signaux d'apprentissage. Les « hyper-connexions » de DeepSeek étendent ce concept en élargissant le flux d'informations entre les couches et en autorisant des configurations plus flexibles. Ceci améliore les performances, mais présente un inconvénient majeur : la complexité accrue compromet la stabilité, car la transmission d'informations n'est plus aussi fiable qu'avec les connexions classiques.

Avec les connexions traditionnelles, l'information reste globalement inchangée lors de sa circulation dans le réseau, ce qui garantit un entraînement stable. Les nouvelles hyperconnexions sacrifient cette caractéristique au profit d'une capacité d'apprentissage accrue, mais cela entraîne des fluctuations importantes lors de l'entraînement de grands modèles. DeepSeek a observé lors d'expériences que les taux d'erreur augmentaient de manière inattendue après environ 12 000 étapes d'entraînement, un signe évident d'instabilité. Les signaux de contrôle du processus d'apprentissage se comportaient de manière chaotique, rendant pratiquement impossible le passage à des modèles plus performants. Parallèlement, l'élargissement des connexions augmentait le trafic de données, car davantage d'informations devaient être transférées entre la mémoire et le processeur.

La solution de DeepSeek projette ces connexions complexes dans un espace mathématique contrôlé (une « variété ») selon des règles fixes. Cette astuce mathématique rétablit la stabilité tout en préservant les avantages d'un échange d'informations plus riche. Cet espace est défini par des matrices spéciales dont les valeurs s'équilibrent pour maintenir la stabilité globale. Bien que cette contrainte puisse paraître technique, elle a des conséquences pratiques importantes : elle garantit que les signaux ne sont ni perdus ni amplifiés de manière incontrôlée lors de leur circulation dans le réseau.

Des essais pratiques menés avec un modèle de 27 milliards de paramètres ont confirmé son efficacité. Les hyperconnexions, tant standard que stabilisées, ont surpassé le modèle de référence, mais la version stabilisée a systématiquement obtenu les meilleurs résultats. La stabilité de l'apprentissage s'est considérablement améliorée. Alors que le modèle standard présentait des pertes de données importantes après 12 000 étapes, l'apprentissage avec la nouvelle méthode s'est déroulé sans problème et a suivi de près le comportement du modèle de référence stable. Les signaux d'apprentissage sont restés dans la plage normale tout au long du processus, ce qui indique une solution fondamentale au problème de stabilité.

Les gains de performance ne sont pas sans conséquence, mais leur coût reste étonnamment modéré. La méthode augmente l'effort de calcul d'environ 6,7 % par rapport à la méthode standard. Ce léger surcroît d'effort est négligeable au regard des gains de performance considérables, faisant de cette méthode l'une des stratégies les plus efficaces de la recherche actuelle. DeepSeek a également mis en œuvre des optimisations rigoureuses de l'infrastructure afin de réduire la charge sur les voies de transmission des données. Ces optimisations sont cruciales car, pour les modèles volumineux, le goulot d'étranglement n'est souvent pas la puissance de calcul elle-même, mais plutôt la vitesse de transfert des données entre la mémoire et le processeur.

En lien avec ceci :

NOUVEAU ! DeepSeek OCR : le triomphe discret de la Chine. Découvrez comment une IA open source sape la domination américaine dans le secteur des puces

La réalité économique derrière les gros titres

Le débat public autour des coûts de DeepSeek a été marqué par de nombreux malentendus dès le départ. Lors de la présentation de son modèle R1 en janvier 2025, les chiffres qui circulaient laissaient entendre que le coût d'entraînement du modèle de base V3 était inférieur à six millions de dollars. Ce montant était souvent comparé aux cent millions de dollars estimés pour GPT-4 d'OpenAI, donnant l'impression que DeepSeek bénéficiait d'un avantage de coût vingt-cinq fois supérieur. En septembre 2025, DeepSeek publiait un article dans la revue Nature affirmant que le coût d'entraînement de R1 n'était que de 294 000 dollars. Ce chiffre a de nouveau dominé la couverture médiatique et renforcé la perception d'un avantage de coût fondamental.

Une analyse plus approfondie révèle cependant une situation plus complexe. Les 294 000 $ concernent exclusivement la phase dite de post-entraînement, durant laquelle un modèle déjà intelligent est affiné par la pratique et le retour d'information. Le coût total réel dépasse 5,87 millions de dollars pour le seul temps de calcul, auxquels s'ajoutent des investissements matériels d'environ 51 millions de dollars. Ces chiffres n'incluent toujours pas les coûts de recherche, de préparation des données, de personnel et d'expérimentations infructueuses. Une fois ces facteurs pris en compte, les coûts de développement réels, bien qu'inférieurs aux chiffres comparables en Occident, n'atteignent pas l'ampleur spectaculaire des chiffres souvent cités.

La structure des coûts du développement de l'IA est intrinsèquement difficile à appréhender. OpenAI n'a jamais publié de chiffres précis concernant GPT-4. L'estimation souvent citée de 100 millions de dollars provient de Sam Altman, qui, en 2023, évoquait des coûts d'entraînement de modèles de base nettement supérieurs. Des estimations analogues pour des modèles plus récents comme GPT-4o suggèrent que les coûts ont considérablement diminué grâce aux techniques modernes telles que les réseaux d'experts spécialisés, des méthodes plus efficaces et une infrastructure optimisée. Certaines analyses situent les coûts d'entraînement de GPT-4o entre 5 et 16 millions de dollars, ce qui signifierait que l'écart de coût avec DeepSeek est considérablement moindre que ce que l'on croit généralement.

Néanmoins, la performance de DeepSeek reste remarquable. L'entreprise a entraîné son modèle V3 avec près de 2,8 millions d'heures de calcul GPU sur 2 048 puces H800 pendant deux mois. La H800 est une version bridée de la H100 de Nvidia, destinée au marché chinois, son débit de transfert de données étant considérablement réduit pour se conformer à la réglementation américaine sur les exportations. Ces puces sont nettement moins puissantes que les modèles originaux utilisés dans les centres de données occidentaux ou même que les processeurs Blackwell, pourtant plus récents. Le fait que DeepSeek ait réussi à développer des modèles compétitifs avec ce matériel limité constitue une véritable avancée.

L'architecture « mixte d'experts » joue un rôle central. DeepSeek V3 possède 671 milliards de paramètres, mais n'en active que 37 milliards par mot. Cela signifie que seule une fraction du modèle est réellement sollicitée pour chaque requête. Le modèle est composé de nombreux « experts » spécialisés et d'un pool de connaissances partagé, seuls quelques spécialistes étant sélectionnés pour chaque étape. Cette conception permet d'accroître considérablement les connaissances du modèle sans augmenter proportionnellement les coûts de calcul. Chaque expert peut se spécialiser dans des domaines spécifiques, ce qui améliore les performances et l'efficacité.

Le défi de cette approche par experts réside dans l'équilibrage de la charge. Si certains experts sont constamment sollicités tandis que d'autres restent inactifs, des problèmes d'efficacité surviennent. Les approches traditionnelles utilisent des « fonctions de pénalité » qui contraignent le modèle à utiliser tous les experts de manière égale. Cependant, cette méthode conduit souvent à des résultats moins performants, car le meilleur expert n'est pas toujours sélectionné. DeepSeek a mis en œuvre une stratégie d'équilibrage de charge intelligente, sans ces pénalités artificielles, garantissant une utilisation équilibrée des experts sans compromettre la qualité. Cette innovation a été cruciale pour la réussite du passage à l'échelle du modèle.

L'impératif stratégique d'innovation pour la Chine

Le développement de DeepSeek ne peut être compris indépendamment du contexte géopolitique. En octobre 2022, les États-Unis ont considérablement durci leurs contrôles à l'exportation sur les puces d'IA et les équipements de fabrication vers la Chine. Ces mesures visaient à limiter la capacité de la Chine à développer des systèmes d'IA avancés et leurs applications militaires. Nvidia a été contrainte de développer des puces spécifiquement adaptées au marché chinois. Les modèles A800 et H800 sont ainsi apparus comme des versions allégées des modèles haut de gamme, avec des vitesses réduites juste assez pour se conformer aux restrictions américaines à l'exportation.

En 2023, les États-Unis ont de nouveau renforcé leurs contrôles, bloquant même ces solutions transitoires. Parallèlement, des restrictions à l'exportation ont été imposées sur la mémoire haute performance, un composant essentiel des puces d'IA modernes. Ces mesures ont contraint les entreprises chinoises à développer des alternatives ou à recourir à du matériel plus ancien et moins performant. Huawei, autrefois géant mondial des télécommunications, s'est retrouvé de fait privé d'accès à la technologie des puces occidentales et a été contraint de développer ses propres solutions. Si les processeurs Ascend de Huawei n'atteignent qu'une fraction des performances par puce de Nvidia, ils compensent en partie ce déficit par leur volume de production important.

Les chiffres de production illustrent bien le défi. Huawei devrait produire environ 200 000 puces d'IA en 2025, tandis que la Chine a pu importer légalement près d'un million de puces Nvidia modifiées durant la même période. De plus, l'écart de performances se creuse. Les analyses montrent que les meilleures puces américaines sont actuellement environ cinq fois plus puissantes que les meilleures puces Huawei, et cet écart devrait s'accroître considérablement d'ici 2027. Même si Huawei augmentait massivement sa production, l'entreprise serait encore loin d'égaler la puissance de calcul déployée par Nvidia à l'échelle mondiale d'ici 2027.

Ces restrictions ont contraint les développeurs chinois à une efficacité radicale. Liang Wenfeng, fondateur de DeepSeek, a perçu très tôt cette nécessité et, dès 2021, avant le durcissement des contrôles, a acquis dix mille GPU Nvidia A100. Cet investissement visionnaire a conféré à DeepSeek un avantage crucial sur ses concurrents, qui n'ont eu accès par la suite qu'à du matériel inférieur. L'ancien gestionnaire de fonds spéculatifs a appliqué la même clairvoyance stratégique qui avait fait son succès dans le secteur financier. Son fonds, High-Flyer, gérait des milliards et figurait parmi les sociétés financières les plus avancées technologiquement en Chine.

La création de DeepSeek en juillet 2023 était bien plus qu'une simple expérience. Liang considérait le développement de l'intelligence artificielle générale comme le projet technologique clé du siècle et souhaitait placer la Chine à l'avant-garde de ce domaine. Dans une interview, il expliquait que les jeunes start-ups spécialisées en IA étaient bien placées pour rivaliser avec les entreprises établies, car le marché connaissait une transformation profonde. Le facteur décisif, selon lui, n'était pas de suivre les anciennes règles, mais plutôt la capacité de s'adapter avec souplesse et de réagir au changement.

Cette philosophie s'est reflétée dans l'approche de développement de DeepSeek. Dès le départ, l'entreprise s'est concentrée sur l'obtention de résultats optimaux avec des ressources limitées. Tandis que des entreprises occidentales comme OpenAI et Anthropic investissaient des milliards dans des modèles toujours plus volumineux et d'immenses centres de données, DeepSeek a optimisé l'architecture, l'entraînement et l'application pour une efficacité maximale. Le modèle R1 a démontré avec brio la pertinence de cette stratégie. Il a obtenu des résultats sur des tâches mathématiques comparables aux meilleurs modèles américains, tout en nécessitant une architecture consommant beaucoup moins de puissance de calcul par réponse.

Une nouvelle dimension de la transformation numérique avec l'IA managée (Intelligence Artificielle) - Plateforme et solution B2B | Xpert Consulting

Une nouvelle dimension de la transformation numérique avec l'IA managée (Intelligence Artificielle) – Plateforme et solution B2B | Xpert Consulting - Image : Xpert.Digital

Vous découvrirez ici comment votre entreprise peut mettre en œuvre des solutions d'IA personnalisées rapidement, en toute sécurité et sans barrières à l'entrée élevées.

Une plateforme d'IA managée est votre solution clé en main pour l'intelligence artificielle. Fini les technologies complexes, les infrastructures coûteuses et les longs processus de développement : vous bénéficiez d'une solution clé en main, adaptée à vos besoins, fournie par un partenaire spécialisé – souvent en quelques jours seulement.

Les principaux avantages en un coup d'œil :

⚡ Mise en œuvre rapide : De l’idée à l’application prête à l’emploi en quelques jours, et non en plusieurs mois. Nous fournissons des solutions pratiques qui créent une valeur ajoutée immédiate.

🔒 Sécurité maximale des données : Vos données sensibles restent chez vous. Nous garantissons un traitement sécurisé et conforme à la réglementation, sans partage de données avec des tiers.

💸 Aucun risque financier : vous ne payez que pour les résultats. Les investissements initiaux importants en matériel, logiciels ou personnel sont totalement éliminés.

🎯 Concentrez-vous sur votre cœur de métier : nous prenons en charge l’intégralité de la mise en œuvre technique, de l’exploitation et de la maintenance de votre solution d’IA.

📈 Évolutif et à l'épreuve du temps : votre IA évolue avec vous. Nous assurons une optimisation et une évolutivité continues, et adaptons les modèles avec souplesse aux nouveaux besoins.

Plus d'informations ici :

Solution d'IA gérée - Services d'IA industrielle : la clé de la compétitivité dans les secteurs des services, de l'industrie et de l'ingénierie mécanique

La fin de la domination de l'IA : comment une startup déjoue les plans de Nvidia et d'OpenAI

Perturbations systémiques et réactions du marché

La sortie de DeepSeek R1 en janvier 2025 a provoqué un véritable séisme, bien au-delà des cercles techniques. Les marchés boursiers ont réagi par des pertes pour les entreprises ayant massivement investi dans l'infrastructure d'IA. Nvidia, dont la valeur reposait en grande partie sur l'hypothèse d'une croissance exponentielle de la demande pour ses puces onéreuses, a vu sa valeur s'effondrer en quelques jours. Les investisseurs se sont interrogés sur la pertinence même de ces dépenses annoncées, se chiffrant en centaines de milliards de dollars, alors qu'une start-up chinoise pouvait obtenir des résultats comparables avec un budget bien moindre.

La réaction des géants technologiques chinois fut immédiate et décisive. ByteDance, Tencent, Baidu et Alibaba ont drastiquement réduit les prix de leurs services d'IA. Le modèle Doubao de ByteDance a vu son prix chuter de près de 99 % en un an. Ces baisses de prix ont entraîné une explosion de l'utilisation. Le nombre de requêtes quotidiennes est passé de 120 milliards à plus de 500 milliards en quelques mois. Le marché global des services d'IA en Chine était valorisé à des sommes relativement faibles, ce qui laisse présager des marges extrêmement réduites compte tenu du volume considérable d'utilisation.

Ces chiffres illustrent un problème : la concurrence se déplace de la qualité de l'IA vers l'efficacité et le prix des infrastructures. Alibaba Cloud, leader du marché en Chine, a néanmoins annoncé des investissements de plusieurs milliards dans les infrastructures d'IA. ByteDance prévoit également des achats massifs de puces. Tencent, qui a pris un certain retard dans l'acquisition de puces, compense ce retard par la location de capacité de calcul et l'utilisation de la technologie performante de DeepSeek.

La consolidation du marché s'accélère. Les experts prévoient que le nombre de fournisseurs chinois d'IA se réduira à quelques acteurs majeurs. Les gagnants seront ceux qui parviendront à imposer leur technologie comme norme en alliant performance et applications concrètes. Ce processus reflète l'évolution d'autres secteurs technologiques, où une période d'innovation rapide est suivie d'une consolidation, seules les entreprises possédant la meilleure combinaison de technologie, de taille et de pouvoir de marché survivant.

Une tendance similaire se dessine en Occident. La domination d'OpenAI s'amenuise sensiblement. La part de marché de ChatGPT a chuté de manière significative, tandis que Google Gemini a progressé. Ce changement dépasse le simple cadre d'une fluctuation statistique. Il indique que l'avantage d'être « le premier sur le marché » s'amenuise, tandis que les concurrents disposant de plateformes établies rattrapent leur retard. Google peut intégrer son IA directement dans la Recherche et Android, ce qui représente un avantage structurel par rapport à un fournisseur d'IA pur.

La tarification reflète cette dynamique. Les fournisseurs occidentaux comme Anthropic et OpenAI ont également baissé leurs prix et introduit des variantes de modèles plus performantes. Le prix par million de mots traités a chuté de façon spectaculaire ces deux dernières années. Cette évolution suggère que l'IA devient un produit de consommation courante. Dès lors que plusieurs fournisseurs proposeront une qualité similaire, le prix deviendra le facteur déterminant, réduisant les marges et accentuant l'importance de l'échelle.

En lien avec ceci :

Quelle est la meilleure option : une infrastructure d’IA décentralisée, fédérée et antifragile, une Gigafactory d’IA ou un centre de données d’IA hyperscale ?

Les limites de la révolution du raisonnement

Parallèlement à cette amélioration de l'efficacité, un développement qui semblait initialement constituer une avancée majeure a vu le jour. Les « modèles de raisonnement », qui prennent davantage de temps pour analyser les problèmes et en détailler explicitement les étapes, ont obtenu des résultats spectaculaires. Les modèles o1 d'OpenAI, R1 de DeepSeek et d'autres modèles similaires ont démontré des capacités impressionnantes en mathématiques et en programmation. L'idée est simple : si l'on donne au modèle plus de temps pour « réfléchir » et lui permettre de formuler le chemin de résolution, les résultats devraient s'améliorer.

Cependant, en juin 2025, Apple a publié une étude révélant des limites. Les chercheurs ont testé des modèles de pointe avec des énigmes logiques dont la difficulté était précisément contrôlable. Les résultats ont été préoccupants : les modèles ont présenté un comportement contradictoire. Leur effort de traitement augmentait initialement avec la complexité, puis diminuait à nouveau à un certain point, malgré un temps suffisant ; les solutions devenaient alors erronées.

L'étude a identifié trois phases. Pour les problèmes simples, les modèles de langage classique se sont souvent révélés plus performants et plus économiques que les modèles de « réflexion ». Pour les problèmes de difficulté moyenne, les processus de réflexion ont offert des avantages indéniables. Cependant, face à des problèmes très complexes, les deux types de modèles ont complètement échoué. Non seulement ils ont manqué de peu la solution, mais ils se sont avérés incapables de trouver ne serait-ce qu'une solution approximativement correcte.

Le plus inquiétant était que même la fourniture de la formule de solution correcte ne changeait pas grand-chose. Les modèles échouaient toujours à des niveaux de difficulté similaires. Cela suggère que les problèmes sont plus profonds : les modèles peinent à exécuter rigoureusement les étapes logiques et à vérifier leur propre raisonnement.

L'analyse des « protocoles de pensée » a révélé des schémas récurrents. Pour les problèmes simples, les modèles trouvaient rapidement la solution, mais s'enlisaient ensuite dans des détails superflus. Face à une complexité élevée, ils s'égaraient souvent. Au-delà d'un certain niveau de difficulté, ils devenaient incapables de générer des approches correctes. Ils s'obstinaient souvent sur des idées initiales erronées et gaspillaient leur temps de calcul à les justifier au lieu de corriger l'erreur.

Une autre étude met en garde contre une possible stagnation prochaine de l'amélioration de ces modèles. Bien qu'ils obtiennent de meilleurs résultats aux tests grâce à une puissance de calcul considérable, cela les rend lents et coûteux. Les conséquences économiques sont importantes : les modèles « penseurs » coûtent beaucoup plus cher à exploiter que les versions standard. Si ces modèles ne parviennent pas aux avancées escomptées et atteignent leurs limites, la question de la justification de ces investissements importants se pose. Le constat que des modèles plus simples sont souvent plus efficaces suggère qu'à l'avenir, il sera nécessaire de choisir avec plus de précision l'outil le mieux adapté à chaque tâche.

En lien avec ceci :

Intelligence artificielle physique autonome (APAI) : la révolution silencieuse de l’intelligence décentralisée

Course aux infrastructures et soif d'énergie

Malgré des logiciels plus performants, la consommation de ressources du secteur ne cesse d'augmenter. Les prévisions indiquent que la demande en électricité des centres de données connaîtra une hausse spectaculaire d'ici la fin de la décennie. La part des applications d'IA dans la consommation mondiale d'électricité des centres de données pourrait doubler. Des sommes colossales sont investies pour répondre à cette demande : des milliers de milliards de dollars à l'échelle mondiale. Des initiatives telles que « Stargate » d'OpenAI et ses partenaires, ou encore les programmes d'investissement européens, témoignent de l'ampleur du défi.

La répartition régionale évolue. Si l'Asie et l'Amérique du Nord sont actuellement en tête, la majorité des nouvelles capacités seront construites aux États-Unis. L'Europe prévoit également d'importants développements, susceptibles d'accroître considérablement la demande d'électricité du continent.

Parallèlement, la densité de puissance dans les centres de données augmente. Les puces d'IA générant une chaleur considérable dans un espace réduit, leur refroidissement devient un défi de plus en plus important. Les systèmes de climatisation classiques s'avèrent souvent insuffisants, d'où la nécessité de systèmes de refroidissement liquide sophistiqués, coûteux et complexes.

Le marché montre des signes de surchauffe. L'utilisation des centres de données augmente, entraînant une hausse des prix. Cette situation ne devrait pas s'améliorer tant que de nombreux projets de construction ne seront pas achevés ou que la croissance de la demande en IA ne ralentira pas. Cependant, si des méthodes efficaces comme celle de DeepSeek se généralisent, le besoin en nouveaux centres de données pourrait être inférieur aux prévisions. Cela remettrait en question les investissements massifs prévus et conduirait à une surcapacité – un risque pour tous ceux qui ont misé sur une demande croissante de matériel informatique.

Stratégies nationales et souveraineté technologique

Le développement de DeepSeek est étroitement lié à la quête d'indépendance de la Chine. Les plans quinquennaux ont fait des semi-conducteurs une priorité, et l'objectif d'autosuffisance est poursuivi avec des efforts considérables. De nouvelles réglementations contraignent les fabricants chinois de puces à utiliser davantage de machines de fabrication nationale. Un fonds d'État investit l'équivalent de près de 50 milliards de dollars dans l'industrie chinoise des semi-conducteurs afin de réduire la dépendance vis-à-vis de l'Occident.

Cette politique produit des effets, parfois inattendus. Auparavant, les usines chinoises privilégiaient les équipements américains. Cependant, les sanctions américaines les ont contraintes à collaborer avec des fournisseurs nationaux, ce qui a accéléré leur développement. La Chine pourrait ainsi rapidement contrôler une part importante de la production mondiale de puces électroniques simples utilisées dans l'automobile et l'électroménager.

Cependant, l'écart demeure important en matière d'IA de pointe. Les puces Huawei ne peuvent rivaliser avec celles de Nvidia en termes de performances, et les volumes de production sont bien trop faibles. Même une augmentation massive de la production ne permettrait pas de combler cet écart avant des années. La demande en puissance de calcul augmentant plus rapidement que la production chinoise, la pénurie ne fera probablement que s'aggraver.

Cela exige des solutions créatives. Le succès de DeepSeek repose également sur son acquisition opportune de puces Nvidia. D'autres ont recours à la contrebande ou à des méthodes indirectes. Le gouvernement réagit par des contre-mesures, telles que des restrictions à l'exportation de terres rares et des enquêtes sur les entreprises technologiques occidentales. La pression sur les entreprises chinoises pour qu'elles achètent des puces produites localement s'accroît, même si celles-ci sont techniquement inférieures.

Paysage réglementaire et gouvernance mondiale

Alors que les États-Unis et la Chine se livrent à une course technologique, l'UE privilégie la réglementation. La loi sur l'intelligence artificielle (AI Act) est la première législation mondiale exhaustive en la matière. Elle interdit les applications particulièrement risquées et établit des règles strictes pour les modèles d'IA puissants. Les infractions sont passibles de lourdes amendes.

L'approche européenne vise à établir des normes éthiques sans entraver l'innovation. Ses détracteurs craignent des désavantages pour les entreprises européennes, tandis que ses partisans y voient un atout à long terme en termes de confiance et de sécurité. À l'échelle mondiale, cependant, la réglementation demeure disparate. Les États-Unis privilégient les engagements volontaires, tandis que la Chine mise sur le contrôle étatique. Cette fragmentation complique l'établissement de normes communes.

La question de la sécurité de l'IA prend de l'importance. Les experts mettent en garde contre les risques liés à une intelligence surhumaine. Le délai pour parvenir à une telle « intelligence artificielle générale » (IAG) s'est raccourci. Les principaux développeurs ne parlent plus de décennies, mais de quelques années seulement. Reste à savoir si cela est réaliste ou s'il s'agit simplement d'un argument marketing, mais l'industrie s'y prépare.

Modèles défaillants et réalignement stratégique

Le retard pris par le successeur de DeepSeek, le R2, montre que le succès n'est pas garanti. Initialement prévu pour une sortie plus précoce, il a rencontré des problèmes. Les tentatives d'entraînement du modèle sur des puces Huawei chinoises ont apparemment échoué malgré l'assistance des ingénieurs de Huawei.

L'entreprise continue donc d'utiliser son stock existant de cartes Nvidia pour la formation, mais doit de plus en plus s'appuyer sur Huawei pour l'application des modèles – un compromis imposé par des considérations politiques. Ces retards ont entraîné une chute temporaire de l'intérêt des utilisateurs, la concurrence restant active.

Un autre problème réside dans les données. Pour atteindre le niveau supérieur, il faut disposer de données d'entraînement plus nombreuses et de meilleure qualité. Dans les pays anglophones, ces données sont facilement accessibles en ligne. En Chine, l'accès à des données de haute qualité est plus difficile, en partie à cause de la censure et en partie parce qu'une grande partie du contenu n'est pas accessible au public. Conjugué à un matériel informatique moins performant, ce problème ralentit le développement. Si l'entraînement prend plus de temps et devient plus complexe, l'avantage économique s'amenuise.

Changement structurel dans l'industrie de l'IA

L'industrie est en pleine transformation. L'ancien adage « plus c'est mieux » — plus de données, plus de puces, plus d'argent — atteint ses limites, voire devient prohibitif. DeepSeek a démontré qu'une architecture intelligente peut primer sur la puissance brute.

Cela a des conséquences pour les investisseurs. Ceux qui ont investi des milliards dans le matériel pourraient rencontrer des difficultés si des logiciels plus performants réduisent la demande. Parallèlement, de nouveaux acteurs ont une chance de se faire une place, car il n'est plus forcément nécessaire d'être fortuné pour participer.

À mesure que les performances de l'IA deviennent plus abordables et homogènes, le modèle lui-même n'est plus le seul facteur déterminant ; l'intégration aux produits est primordiale. Google et Microsoft bénéficient d'un avantage certain grâce à leur base d'utilisateurs déjà établie. Les startups spécialisées en IA pure sont confrontées à des défis plus importants. Les logiciels libres, ou open source, jouent un rôle de plus en plus crucial. Des modèles comme ceux de DeepSeek ou Meta sont accessibles à tous, ce qui accélère l'innovation.

Dans le même temps, les investisseurs s'interrogent sur le retour sur investissement. ChatGPT compte de nombreux utilisateurs, mais son coût est exorbitant. Les profits importants ne sont pas pour demain. De nouveaux emplois pour les experts en IA émergent sur le marché du travail, tandis que les tâches administratives courantes s'automatisent – un défi sociétal pour lequel il n'existe pas encore de solution miracle.

Après l'engouement pour l'IA : la véritable bataille pour la monétisation commence

Les innovations de DeepSeek marquent un tournant. Elles prouvent qu'une technologie de pointe peut être développée même avec des ressources limitées. Cela remet en question l'idée reçue selon laquelle seules les entreprises américaines les plus riches peuvent l'emporter. La compétition ne se résume plus à « Qui a le plus d'argent ? » mais à « Qui a les meilleurs ingénieurs ? ».

Sur le plan géopolitique, il est clair que les sanctions peuvent ralentir le progrès, mais elles peuvent aussi stimuler l'innovation. La Chine développe sa propre industrie sous pression. Sur le plan économique, nous n'en sommes qu'aux prémices. Les prix baissent et les modèles deviennent des produits de consommation courante. Ceux qui veulent réussir à l'avenir doivent non seulement concevoir une IA performante, mais aussi être capables d'en tirer profit.

Des obstacles techniques persistent. Les méthodes actuelles atteignent leurs limites, et l'avènement d'une intelligence comparable à l'intelligence humaine dans un avenir proche reste incertain. Les prochaines années nous diront si le secteur parviendra à surmonter ces obstacles ou si l'engouement s'estompera. La leçon la plus importante de DeepSeek n'est peut-être pas d'ordre technique, mais stratégique : il existe toujours une autre solution si l'on est contraint de la trouver.

Votre partenaire mondial en marketing et développement commercial

☑️ Notre langue de travail est l'anglais ou l'allemand

☑️ NOUVEAU : Correspondance dans votre langue maternelle !

Konrad Wolfenstein

Mon équipe et moi-même sommes heureux de pouvoir vous accompagner en tant que conseiller personnel.

Vous pouvez me contacter en remplissant le formulaire de contact ici wolfenstein@xpert.digital :ou simplement m'appeler au +49 7348 4088 965. Mon adresse e-mail est

J'attends avec impatience notre projet commun.

☑️ Accompagnement des PME en matière de stratégie, de conseil, de planification et de mise en œuvre

☑️ Création ou réalignement de la stratégie numérique et de la numérisation

☑️ Expansion et optimisation des processus de vente internationaux

☑️ Plateformes de commerce B2B mondiales et numériques

☑️ Développement commercial pionnier / Marketing / Relations publiques / Salons professionnels

🎯🎯🎯 Bénéficiez de l'expertise étendue et quintuple de Xpert.Digital dans une offre de services complète : développement commercial, recherche et développement, expérience client (XR), relations publiques et optimisation de la visibilité numérique

Bénéficiez de l'expertise approfondie et diversifiée d'Xpert.Digital, articulée autour de cinq axes, grâce à une offre de services complète : R&D, XR, RP et optimisation de la visibilité numérique. – Image : Xpert.Digital

Xpert.Digital possède une connaissance approfondie de divers secteurs d'activité. Cela nous permet d'élaborer des stratégies sur mesure, parfaitement adaptées aux exigences et aux défis de votre segment de marché spécifique. En analysant en permanence les tendances du marché et en suivant l'évolution du secteur, nous agissons de manière proactive et proposons des solutions innovantes. L'alliance de notre expérience et de notre expertise génère une valeur ajoutée et confère à nos clients un avantage concurrentiel décisif.

Plus d'informations ici :