Spread the love

La jeune pousse a bouleversé le secteur de l’IA en quelques jours seulement.

0 𝕏

Qui est DeepSeek, la startup chinoise qui fait trembler la planète IA ?

© QINQIE99 / Shutterstock.com 𝕏

Un nouveau champion de l’intelligence artificielle (IA) vient d’émerger, et il est est tout droit venu de l’Empire du Milieu. De quoi hérisser les poils des géants de la Silicon Valley et des dirigeants américains…

Un coût d’entraînement minime par rapport à OpenAI

C’est un véritable raz-de-marée. En seulement quelques jours, le modèle de DeepSeek, R1, est arrivé en tête des téléchargements gratuits sur les iPhone aux États-Unis. Il figure, en outre, parmi les applications de productivité les plus téléchargées dans le Google Play Store.

La startup, fondée en 2023 par Liang Wenfeng, un gestionnaire de fonds spéculatifs, se concentre principalement sur la recherche en dépit de la commercialisation. Dans cette optique, elle a déployé son modèle en open source, permettant aux chercheurs d’exploiter son algorithme. La force de son IA : elle peut apprendre et s’améliorer automatiquement sans supervision humaine. De même, lorsqu’elle développe ses réponses, elle étaye son raisonnement à l’utilisateur. Une fonctionnalité plébiscitée par ces derniers.

Les détails techniques de R1 ont estomaqué les chercheurs, et pour cause. Il serait aussi performant, voire plus dans certains cas, que le modèle o1 d’OpenAI. Le tout en ayant nécessité « que » 5,6 millions de dollars pour son entraînement, soit une fraction du coût des modèles comparables développés par les géants américains.

200% Deposit Bonus up to €3,000 180% First Deposit Bonus up to $20,000

Et la jeune pousse voit grand, avec l’ambition d’atteindre prochainement l’intelligence artificielle générale, c’est-à-dire capable d’effectuer ou d’apprendre n’importe quelle tâche cognitive propre aux humains.

Qui est DeepSeek, la startup chinoise qui fait trembler la planète IA ?

Capture d’écran de l’application DeepSeek sur l’App Store. © Presse-citron

La résilience chinoise

DeepSeek aurait utilisé 2 048 puces H800 de NVIDIA. Ce GPU est beaucoup moins efficace que le H100 exploité par les entreprises outre-Atlantique, mais la startup regorge d’ingénieurs locaux ultra talentueux, issus des meilleures universités du pays. Ils ont ainsi été en mesure d’optimiser les accélérateurs.

C’est un sacré coup porté aux mastodontes américains, car la prouesse de DeepSeek prouve que les dépenses colossales ne sont pas forcément nécessaires pour développer des modèles puissants. Cela remet en cause les stratégies d’investissement déployées au sein de la Silicon Valley.

Pire encore, la startup témoigne des capacités de la Chine à outrepasser les lourdes sanctions qui pèsent à son encontre, le gouvernement américain interdisant ses entreprises à lui livrer des puces de pointe. Dans ce contexte, son fondateur Liang Wenfeng est érigé au rang de héros national.

Les géants technologiques chinois se concentrent eux aussi sur des modèles concurrents à ChatGPT et consorts, mais la concurrence va encore s’intensifier avec le projet Stargate. À hauteur de 500 milliards de dollars, il consiste à construire une immense infrastructure aux États-Unis, afin de soutenir les capacités d’IA d’OpenAI.

  • DeepSeek, jeune startup chinoise, fait trembler la Silicon Valley avec son modèle open source R1.
  • Capable de raisonner, il est comparable à o1 d’OpenAI. Mais il a coûté drastiquement moins cher.
  • Le modèle témoigne des capacités de la Chine à passer outre les sanctions américaines.

[ ]

Teilor Stone

By Teilor Stone

Teilor Stone has been a reporter on the news desk since 2013. Before that she wrote about young adolescence and family dynamics for Styles and was the legal affairs correspondent for the Metro desk. Before joining Thesaxon , Teilor Stone worked as a staff writer at the Village Voice and a freelancer for Newsday, The Wall Street Journal, GQ and Mirabella. To get in touch, contact me through my teilor@nizhtimes.com 1-800-268-7116