Donald Trump a fait retarder la prochaine version de DeepSeek avec son modèle R2. En cause, une nouvelle puce de Nvidia interdite en Chine par le Président américain.

Le développement du modèle R2 de DeepSeek est en suspens en raison des contrôles à l’exportation américains qui perturbent son développement. Les puces Nvidia, en particulier le H20 récemment interdit, sont devenues rares en Chine en raison de réglementations américaines plus strictes. Le PDG Liang Wenfeng n’est pas satisfait des performances du R2, et aucune date de sortie n’a encore été fixée.
Les modèles de DeepSeek sont fortement optimisés pour le matériel Nvidia, et les alternatives chinoises ne peuvent pas égaler la puissance de Nvidia. Malgré ce revers, une mise à jour de fin mai du modèle R1 a ramené ses performances au niveau des meilleurs modèles d’OpenAI et de Google.
L’équipe d’ingénierie de DeepSeek a travaillé sur l’affinage du modèle R2, mais le déploiement est entravé par une pénurie de puces serveurs Nvidia en Chine, attribuée aux réglementations américaines à l’exportation. Cette pénurie pourrait entraver l’adoption rapide du modèle.
DeepSeek a coordonné ses efforts avec des entreprises locales de cloud, partageant des spécifications techniques pour les préparer à héberger et à distribuer le modèle R2. Actuellement, la plupart des clients cloud de DeepSeek exploitent le modèle R1 en utilisant les puces H20 de Nvidia, soulignant la dépendance à ces processeurs.
Des restrictions à l’exportation imposées en avril ont empêché Nvidia de vendre ses puces H20 sur le marché chinois. DeepSeek retarde le lancement de R2, successeur du modèle R1, en raison de l’insatisfaction du PDG concernant les progrès.
Les efforts du gouvernement américain pour freiner le développement de l’IA en Chine n’ont pas empêché DeepSeek de créer son application d’IA générative de manière efficace. Le secteur technologique a rapidement fait son lobbying auprès de la nouvelle administration, avec plusieurs PDG majeurs présents à l’inauguration.
DeepSeek a décidé d’utiliser des ressources internes pour son prochain modèle grand public, atteignant 82% d’utilisation du cluster de puces Ascend 910B de Huawei. Le modèle R2 devrait adopter une architecture hybride MoE, avec deux fois plus de paramètres que R1.