La jeune pousse a bouleversé le secteur de l’IA en quelques jours seulement.
0 𝕏
© QINQIE99 / Shutterstock.com 𝕏
Un nouveau champion de l’intelligence artificielle (IA) vient d’émerger, et il est est tout droit venu de l’Empire du Milieu. De quoi hérisser les poils des géants de la Silicon Valley et des dirigeants américains…
C’est un véritable raz-de-marée. En seulement quelques jours, le modèle de DeepSeek, R1, est arrivé en tête des téléchargements gratuits sur les iPhone aux États-Unis. Il figure, en outre, parmi les applications de productivité les plus téléchargées dans le Google Play Store.
La startup, fondée en 2023 par Liang Wenfeng, un gestionnaire de fonds spéculatifs, se concentre principalement sur la recherche en dépit de la commercialisation. Dans cette optique, elle a déployé son modèle en open source, permettant aux chercheurs d’exploiter son algorithme. La force de son IA : elle peut apprendre et s’améliorer automatiquement sans supervision humaine. De même, lorsqu’elle développe ses réponses, elle étaye son raisonnement à l’utilisateur. Une fonctionnalité plébiscitée par ces derniers.
Les détails techniques de R1 ont estomaqué les chercheurs, et pour cause. Il serait aussi performant, voire plus dans certains cas, que le modèle o1 d’OpenAI. Le tout en ayant nécessité « que » 5,6 millions de dollars pour son entraînement, soit une fraction du coût des modèles comparables développés par les géants américains.
200% Deposit Bonus up to €3,000 180% First Deposit Bonus up to $20,000Et la jeune pousse voit grand, avec l’ambition d’atteindre prochainement l’intelligence artificielle générale, c’est-à-dire capable d’effectuer ou d’apprendre n’importe quelle tâche cognitive propre aux humains.
Capture d’écran de l’application DeepSeek sur l’App Store. © Presse-citron
DeepSeek aurait utilisé 2 048 puces H800 de NVIDIA. Ce GPU est beaucoup moins efficace que le H100 exploité par les entreprises outre-Atlantique, mais la startup regorge d’ingénieurs locaux ultra talentueux, issus des meilleures universités du pays. Ils ont ainsi été en mesure d’optimiser les accélérateurs.
C’est un sacré coup porté aux mastodontes américains, car la prouesse de DeepSeek prouve que les dépenses colossales ne sont pas forcément nécessaires pour développer des modèles puissants. Cela remet en cause les stratégies d’investissement déployées au sein de la Silicon Valley.
Pire encore, la startup témoigne des capacités de la Chine à outrepasser les lourdes sanctions qui pèsent à son encontre, le gouvernement américain interdisant ses entreprises à lui livrer des puces de pointe. Dans ce contexte, son fondateur Liang Wenfeng est érigé au rang de héros national.
Les géants technologiques chinois se concentrent eux aussi sur des modèles concurrents à ChatGPT et consorts, mais la concurrence va encore s’intensifier avec le projet Stargate. À hauteur de 500 milliards de dollars, il consiste à construire une immense infrastructure aux États-Unis, afin de soutenir les capacités d’IA d’OpenAI.
[ ]
Victor, Stella et Cléa, trois étudiants qui exposent à la Chapelle du Quartier Haut jusqu’à…
The Socialists are considering filing a motion of censure as a crucial joint committee (CMP)…
Fabien Galthie vient de dévoiler sa composition pour le match face au pays de Galles.…
Auger-Aliassime était simplement plus fort, mercredi soir. Midi Libre - GIACOMO ITALIANO Beaten again by…
The Socialists are considering filing a motion of censure as a crucial joint committee (CMP)…
Auger-Aliassime était simplement plus fort, mercredi soir. Midi Libre - GIACOMO ITALIANO Beaten again by…