La jeune pousse a bouleversé le secteur de l’IA en quelques jours seulement.
0 𝕏
© QINQIE99 / Shutterstock.com 𝕏
Un nouveau champion de l’intelligence artificielle (IA) vient d’émerger, et il est est tout droit venu de l’Empire du Milieu. De quoi hérisser les poils des géants de la Silicon Valley et des dirigeants américains…
Un coût d’entraînement minime par rapport à OpenAI
C’est un véritable raz-de-marée. En seulement quelques jours, le modèle de DeepSeek, R1, est arrivé en tête des téléchargements gratuits sur les iPhone aux États-Unis. Il figure, en outre, parmi les applications de productivité les plus téléchargées dans le Google Play Store.
La startup, fondée en 2023 par Liang Wenfeng, un gestionnaire de fonds spéculatifs, se concentre principalement sur la recherche en dépit de la commercialisation. Dans cette optique, elle a déployé son modèle en open source, permettant aux chercheurs d’exploiter son algorithme. La force de son IA : elle peut apprendre et s’améliorer automatiquement sans supervision humaine. De même, lorsqu’elle développe ses réponses, elle étaye son raisonnement à l’utilisateur. Une fonctionnalité plébiscitée par ces derniers.
Les détails techniques de R1 ont estomaqué les chercheurs, et pour cause. Il serait aussi performant, voire plus dans certains cas, que le modèle o1 d’OpenAI. Le tout en ayant nécessité « que » 5,6 millions de dollars pour son entraînement, soit une fraction du coût des modèles comparables développés par les géants américains.
200% Deposit Bonus up to €3,000 180% First Deposit Bonus up to $20,000Et la jeune pousse voit grand, avec l’ambition d’atteindre prochainement l’intelligence artificielle générale, c’est-à-dire capable d’effectuer ou d’apprendre n’importe quelle tâche cognitive propre aux humains.
Capture d’écran de l’application DeepSeek sur l’App Store. © Presse-citron
La résilience chinoise
DeepSeek aurait utilisé 2 048 puces H800 de NVIDIA. Ce GPU est beaucoup moins efficace que le H100 exploité par les entreprises outre-Atlantique, mais la startup regorge d’ingénieurs locaux ultra talentueux, issus des meilleures universités du pays. Ils ont ainsi été en mesure d’optimiser les accélérateurs.
C’est un sacré coup porté aux mastodontes américains, car la prouesse de DeepSeek prouve que les dépenses colossales ne sont pas forcément nécessaires pour développer des modèles puissants. Cela remet en cause les stratégies d’investissement déployées au sein de la Silicon Valley.
Pire encore, la startup témoigne des capacités de la Chine à outrepasser les lourdes sanctions qui pèsent à son encontre, le gouvernement américain interdisant ses entreprises à lui livrer des puces de pointe. Dans ce contexte, son fondateur Liang Wenfeng est érigé au rang de héros national.
Les géants technologiques chinois se concentrent eux aussi sur des modèles concurrents à ChatGPT et consorts, mais la concurrence va encore s’intensifier avec le projet Stargate. À hauteur de 500 milliards de dollars, il consiste à construire une immense infrastructure aux États-Unis, afin de soutenir les capacités d’IA d’OpenAI.
- DeepSeek, jeune startup chinoise, fait trembler la Silicon Valley avec son modèle open source R1.
- Capable de raisonner, il est comparable à o1 d’OpenAI. Mais il a coûté drastiquement moins cher.
- Le modèle témoigne des capacités de la Chine à passer outre les sanctions américaines.
[ ]