Nvidia n’a même pas eu accès au modèle. Pour la première fois dans l’histoire de l’intelligence artificielle, un modèle de pointe sera entraîné et déployé sans la moindre puce américaine. DeepSeek, la startup chinoise de Hangzhou, s’apprête à lancer V4 dans les prochaines semaines, et le choix du matériel envoie un message limpide à Washington : la Chine n’a plus besoin de la Silicon Valley pour faire tourner ses cerveaux artificiels.
Alibaba, ByteDance, Tencent : la ruée sur les puces Huawei
Cinq personnes au courant des transactions l’ont confirmé à The Information : les trois géants chinois du cloud ont passé commande de centaines de milliers de puces Ascend 950PR, le dernier processeur IA de Huawei. La demande a fait grimper les prix de 20 % en quelques semaines, selon le même média.
Derrière ces commandes massives, un calcul simple. DeepSeek V4 repose sur une architecture « mixture-of-experts » d’environ 1 000 milliards de paramètres au total, dont seulement 37 milliards s’activent à chaque requête. Résultat : des performances comparables à celles de GPT-4o, pour une fraction de la puissance de calcul. Le modèle accepte du texte, des images et du code dans la même fenêtre de contexte, rapporte Prism News.
Pour faire tourner cette machine, les ingénieurs de DeepSeek ont passé plusieurs mois à réécrire des pans entiers du code en collaboration avec Huawei et Cambricon Technologies, un concepteur de puces basé à Shanghai. L’objectif : que V4 soit natif sur silicium chinois, pas simplement « compatible ».
L’Ascend 950PR, 2,8 fois plus puissant que le H20 de Nvidia
Présenté le 20 mars lors du Ascend AI Partner Summit, le processeur Huawei affiche 1,56 pétaflops en précision FP4, soit 2,87 fois les performances du Nvidia H20, la puce bridée que les Américains sont autorisés à vendre en Chine. Le tout adossé à 112 Go de mémoire HBM propriétaire HiZQ 2.0, avec une bande passante de 4 To/s, détaille Huawei Central.
Le revers de la médaille : une consommation de 600 watts par carte, le double du H20. Et l’Ascend 950PR ne fait toujours pas jeu égal avec le H200 de Nvidia, la puce haut de gamme interdite d’export vers la Chine. Selon les propres chercheurs de DeepSeek cités par Prism News, le précédent Ascend 910C ne livrait qu’environ 60 % des performances d’inférence du H100.
La stratégie contourne cette limite par le volume. Configuré en grappe via l’architecture CloudMatrix 384 de Huawei, le système atteint 6 688 jetons par seconde en pré-remplissage et 1 943 en décodage, avec des optimisations taillées pour les architectures mixture-of-experts. À l’échelle d’un datacenter, l’économie d’inférence devient compétitive face au H100.
Le modèle qui avait fait perdre 600 milliards à Nvidia revient frapper plus fort
En janvier 2025, le lancement de DeepSeek V3 avait provoqué la plus grosse chute boursière de l’histoire pour une seule entreprise : 17 % en une séance, soit près de 600 milliards de dollars de capitalisation envolés pour Nvidia. La démonstration que des modèles performants pouvaient tourner sur du matériel moins coûteux avait ébranlé la thèse d’investissement de tout le secteur.
V4 pousse la logique jusqu’au bout. En écartant délibérément Nvidia et AMD de la phase d’accès anticipé, DeepSeek rompt avec une norme tacite du secteur. D’habitude, les entreprises d’IA travaillent avec plusieurs fabricants de puces avant le lancement. Ici, seuls Huawei et Cambricon ont eu accès au modèle en amont, rapporte The Information.
Pour Nvidia, le timing est cruel. Le 17 mars, Jensen Huang annonçait lors de la conférence GTC avoir obtenu des licences du gouvernement américain pour reprendre la vente de puces H200 en Chine. Mais selon le Financial Times, Nvidia a depuis suspendu la production de ces puces à destination du marché chinois, faute de perspectives de ventes significatives à court terme. Pékin envisagerait de son côté d’imposer une taxe de 25 % sur ces importations, rapporte CNBC.
La part de marché chinoise bascule
Les fabricants chinois de semi-conducteurs contrôlent désormais près de 50 % du marché domestique des puces IA, selon des données citées par MSN, contre une position autrefois ultra-dominante de Nvidia. Les restrictions à l’exportation imposées par Washington depuis 2022 ont accéléré la bascule : chaque embargo supplémentaire pousse les géants chinois à investir massivement dans les alternatives locales.
DeepSeek ne s’arrête pas à V4. La startup développe deux variantes supplémentaires du modèle, chacune optimisée pour des capacités différentes et conçue spécifiquement pour du matériel chinois, selon l’Economic Times. Une stratégie multi-modèles qui pourrait donner à la Chine un portefeuille d’IA diversifié, capable de rivaliser sur plusieurs fronts.
Chaque optimisation logicielle écrite pour l’écosystème Ascend réduit le coût de migration pour les entreprises encore dépendantes de Nvidia. L’effet boule de neige joue à plein : plus il y a de modèles optimisés pour les puces chinoises, moins le retour vers Nvidia a de sens économique.
L’embargo technologique se retourne contre ses architectes
Le paradoxe est vertigineux. Les restrictions américaines visaient à freiner l’essor de l’IA chinoise en coupant l’accès aux puces les plus avancées. Quatre ans plus tard, elles ont produit l’effet inverse : un écosystème de semi-conducteurs chinois qui monte en puissance à marche forcée, une startup comme DeepSeek qui conçoit des modèles de pointe indépendants du matériel américain, et des commandes massives qui valident la feuille de route industrielle de Huawei.
Si V4 tient ses promesses d’inférence à grande échelle sur puces Ascend, la justification stratégique des embargos s’effondrera dans les faits, pas seulement en théorie. Le lancement est attendu dans les prochaines semaines. Les bourses, elles, pourraient réagir bien avant.