PolitiqueSécurité

Comment « Deep Seek » redéfinit-il la concurrence mondiale dans le domaine de l’intelligence artificielle ?

L’émergence de l’application chinoise Deep Seek a suscité des interrogations sur les limites de la concurrence mondiale concernant le développement de la technologie de l’intelligence artificielle. Au cours de la dernière décennie, les modèles de langage volumineux (LLMs) ont connu un bond qualitatif significatif dans leurs capacités. En 2017, un article de recherche intitulé « Attention is All You Need » a été publié par huit chercheurs de Google, introduisant le mécanisme d’attention utilisé dans le développement des grands modèles de langage. Cela est devenu clairement évident au public avec le lancement de l’application ChatGPT à la fin de novembre 2022. Avec l’émergence de plusieurs chatbots américains, des questions ont commencé à se poser sur la position de la Chine dans ces développements, surtout alors que les avancées en IA devenaient un enjeu central dans la concurrence entre les États-Unis et la Chine. Malgré la présence de diverses discussions, interprétations de données et écrits concernant l’avancement de la recherche et des applications en IA, avec de nombreux doutes sur la capacité de Pékin à réaliser le même niveau de progrès que les États-Unis, le lancement de Deep Seek a confirmé que la Chine avait réalisé des avancées significatives dans le domaine de l’IA, créant un sentiment de chaos sur le marché de l’IA américain.

Caractéristiques Clés Certains experts en technologie de l’intelligence artificielle, tels qu’Aravind Srinivasan, PDG de Perplexity AI, ont décrit l’application chinoise « Deep Seek » — en particulier son modèle basé sur la logique R1 — comme la plus grande transformation technologique que l’humanité ait connue depuis l’avènement d’Internet. Cela est attribué à plusieurs caractéristiques distinctives de l’application par rapport à d’autres dans le domaine, que l’on peut résumer comme suit :

Priorisation des Modèles Open Source : L’application chinoise repose sur un modèle de recherche différent des approches occidentales pour les grands modèles de langage. La sortie des modèles « Deep Seek V3 » et « Deep Seek R1 » a ouvert les yeux de nombreuses personnes dans le monde sur ce qui se passe réellement en matière d’IA en Chine. Ce modèle démontre que l’équipe de recherche s’appuie sur diverses études et techniques distinctes de celles utilisées aux États-Unis. Fait intéressant, les standards de référence pour ce modèle sont accessibles à tous, étant open source, ce qui signifie que n’importe quel développeur peut télécharger le modèle, héberger cette API sur son propre serveur et le tester pour vérifier ses capacités et caractéristiques revendiquées, y compris en comparant ses résultats avec ceux d’autres modèles disponibles.

Développé avec des Coûts Relativement Bas : Un autre aspect frappant de ce modèle est son coût de développement relativement bas, qui semble dérisoire comparé aux coûts de production engagés par des modèles occidentaux similaires, représentant un nouvel bouleversement radical dans le domaine de l’IA dans son ensemble. Bien que le coût exact du lancement et du développement de cette application ne soit pas précisément connu, des experts affirment qu’il ne s’approche pas des coûts de développement des modèles occidentaux, avec des estimations autour de 10 millions de dollars, tandis que des modèles similaires aux États-Unis peuvent coûter des centaines de millions de dollars.

Expansion par le biais de la Technologie de Distillation : En plus des défis de coût, les grands modèles de langage utilisés en Occident consomment d’énormes quantités de puissance de calcul et d’infrastructure. Les modèles de langage open source, qu’il s’agisse des modèles LLaMA ou d’autres aux États-Unis, reposent sur un processus connu sous le nom de distillation. Ce processus utilise simplement un modèle très grand pour aider des modèles plus petits visant à effectuer des tâches spécifiques (comme développer un modèle de langage pour aider les avocats à comprendre l’ensemble des lois et réglementations liées à divers cas). Cela est très rentable, permettant à ces équipes d’utiliser des APIs minimales, en téléchargeant le modèle open source et en entraînant des modèles plus petits avec celui-ci. « Deep Seek » a appliqué cette logique à un niveau plus large et plus profond.

Utilisation du Mécanisme de Mélange d’Experts : Les équipes de recherche chinoises impliquées dans le développement de l’application ont employé une nouvelle méthode d’ingénierie appelée le « mélange d’experts ». Dans cette approche, la Chine a divisé son grand modèle de langage en différents segments spécialisés, le modèle principal recevant les commandes des utilisateurs et redistribuant ces commandes aux segments spécialisés pertinents. Par exemple, si une question concerne le droit, elle est rapidement dirigée vers le modèle spécialiste légal pour une réponse.

Incorporation de Services Logiciels Distincts : Les caractéristiques du modèle IA chinois « Deep Seek » vont au-delà de son coût de production exceptionnellement bas par rapport aux autres modèles de langage américains et de sa disponibilité gratuite pour tous les utilisateurs. Ses avantages sont particulièrement évidents dans les aspects techniques liés à la programmation et à l’analyse de données. Par exemple, lorsqu’on lui demande de créer une interface de site Web en utilisant HTML, le programme, similaire à son plus proche concurrent « ChatGPT », écrit le code complet du site, permettant aux utilisateurs de tester le code et de voir le résultat final. En revanche, ChatGPT ne propose pas cette fonctionnalité et nécessite que les utilisateurs utilisent un éditeur de texte ou une plateforme externe pour tester le code et afficher le résultat final.

Utilisation de l’Apprentissage par Renforcement : Certains rapports suggèrent que les modèles de Deep Seek reposent sur une méthode connue sous le nom d’apprentissage par renforcement, leur permettant d’apprendre par essai et erreur, d’interagir avec leur environnement et d’incorporer les retours et évaluations des utilisateurs. Cette approche leur permet d’évoluer et d’acquérir des expériences imitant le comportement humain, contrairement à d’autres modèles qui dépendent d’un apprentissage dirigé par les développeurs basé sur leurs instructions et données d’entrée.

Implications Majeures Les États-Unis et la Chine sont engagés dans une concurrence technologique significative souvent qualifiée de guerre. Parmi ses éléments marquants figure l’imposition par les États-Unis d’une interdiction stricte de transfert de toute technologie américaine impliquée dans la fabrication de semi-conducteurs, une prohibition à laquelle le Japon et les Pays-Bas ont également participé. Avec la révélation de cette application, la Chine souligne l’inefficacité des mesures américaines pour empêcher Pékin d’accéder aux technologies avancées, notamment en IA, qui est devenue une priorité absolue pour la nouvelle administration américaine. Les principales implications à court et à long terme de la révélation de cette application incluent les points suivants :

Fort Déclin du Marché Boursier Américain : Le 27 janvier, le marché boursier américain a connu un fort déclin des actions, en particulier des entreprises technologiques. Par exemple, le cours des actions de Nvidia, l’entreprise derrière les puces avancées dominants de nombreux investissements en IA, a chuté de 17 %, perdant près de 600 milliards de dollars de valeur boursière et étant la plus touchée. Les investisseurs se sont précipités pour vendre leurs actions afin de réévaluer leurs décisions d’investissement suite à la révélation par la Chine d’un modèle de langage volumineux supérieur et à moindre coût. Bien que les actions technologiques américaines se soient stabilisées le jour suivant (28 janvier), avec une reprise de plus de 6 % des actions Nvidia à la mi-séance, des experts ont noté que cette vague de vente des actions IA aux États-Unis pourrait être une exagération ; cependant, l’impact de l’application sur le marché technologique américain et ses leaders reste difficile à quantifier à l’heure actuelle.

Doutes Accrus sur la Dominance de l’IA par Washington : Le président américain Donald Trump a décrit le moment où l’application chinoise a été révélée comme un signal d’alarme significatif pour l’industrie technologique américaine, mais a également indiqué que cela pourrait finalement être « positif » pour les États-Unis. Il a justifié cela en déclarant : « Si vous pouvez faire la même chose à un coût inférieur et obtenir le même résultat, je pense que c’est bon pour nous. » Il a ajouté qu’il n’est pas concerné par cette percée, soulignant que les États-Unis resteraient un acteur dominant dans ce domaine.

Accusations Contre l’Application Chinoise de Copier les Modèles d’OpenAI : Le 29 janvier, OpenAI, propriétaire de l’application ChatGPT, a accusé des entreprises chinoises et d’autres d’essayer de copier son modèle d’IA, appelant à une coopération renforcée avec les autorités américaines et aux mesures de sécurité. OpenAI a souligné que de telles actions contredisent ses conditions d’utilisation et qu’elle travaille à trouver des moyens d’identifier et de prévenir de futures tentatives à cet égard.

Scepticisme sur l’Efficacité des Sanctions Américaines sur le Secteur Technologique Chinois : La nature spécifique et le type de technologie dont la Chine s’est appuyée pour développer ce modèle demeurent flous, surtout puisque les unités de traitement graphique (GPU), fondamentales au fonctionnement des grands modèles de langage, sont principalement produites par Nvidia, qui est sous interdiction d’exportation vers la Chine. Les experts divergent dans leurs conclusions à ce sujet ; certains estiment que le modèle chinois pourrait avoir utilisé des GPU différents disponibles en Chine, notant que les laboratoires de recherche en IA obtiennent parfois accès aux dernières unités avancées. D’autres soutiennent que la Chine pourrait avoir constitué des stocks de GPU américains avant l’imposition des interdictions d’exportation. Néanmoins, le modèle chinois suggère que les experts là-bas ont réussi à utiliser les appareils et technologies disponibles de manière plus efficace, indiquant l’inefficacité des restrictions américaines sur l’industrie technologique chinoise et menacant la domination de Washington dans ce domaine.

Concurrence Mondiale Renforcée en IA : Naturellement, le lancement de Deep Seek et de ses divers modèles, qui reposent sur les principes de l’open source et de la disponibilité gratuite, va intensifier la concurrence mondiale dans le domaine de l’intelligence artificielle. Les États-Unis devraient pousser à contrer ces avancées chinoises, surtout alors que Trump vise à renforcer la position américaine en IA. Il est également prévu que les entreprises américaines augmentent leurs investissements dans ce domaine. À l’inverse, la Chine continuera ses initiatives pour renforcer son influence technologique, incitant potentiellement d’autres puissances à développer de nouvelles applications.

En conclusion, cette révélation devrait intensifier la concurrence technologique entre la Chine et les États-Unis ; cependant, elle pourrait également soutenir les efforts de plusieurs entreprises cherchant à développer leurs technologies IA existantes manquant de financement et de capacités suffisantes pour de tels avancements. Ce modèle soulève également des questions sur le niveau de développement dans ce domaine dans d’autres pays, notamment en Europe et en Russie, et si ces nations dépenseront plus d’efforts et de fonds pour développer des recherches connexes ou resteront simplement spectatrices pendant que la Chine et les États-Unis dominent complètement le champ.

Mohamed SAKHRI

Je suis Mohamed Sakhri, fondateur de World Policy Hub. Je suis titulaire d’une licence en science politique et relations internationales, ainsi que d’un master en études de sécurité internationale. Mon parcours académique m’a offert une solide base en théorie politique, affaires mondiales et études stratégiques, me permettant d’analyser les défis complexes auxquels sont confrontés aujourd’hui les États et les institutions politiques.

Articles similaires

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *


Bouton retour en haut de la page