Mais la société chinoise DeepSeek, spécialisée dans le développement de l’IA, a bouleversé cette idée. Le 20 janvier 2025, DeepSeek a publié son LLM R1 pour une fraction du coût que les autres fournisseurs ont encouru pour leurs propres développements.
DeepSeek fournit également ses modèles R1 sous une licence open source, ce qui permet de les utiliser librement.
Quelques jours après sa sortie, l’assistant IA de DeepSeek – une application mobile qui fournit une interface de chatbot pour DeepSeek R1 – a atteint le sommet du classement de l’App Store d’Apple, dépassant l’application mobile ChatGPT d’OpenAI.
L’ascension fulgurante de DeepSeek en termes d’utilisation et de popularité a déclenché une liquidation boursière le 27 janvier 2025, les investisseurs mettant en doute la valeur des grands fournisseurs d’IA basés aux États-Unis, notamment Nvidia.
Microsoft, Meta Platforms, Oracle, Broadcom et d’autres géants de la technologie de pointe ont également connu des baisses significatives lorsque les investisseurs ont réévalué les valorisations de l’IA.
Qu’est-ce que DeepSeek ?
La startup DeepSeek a été fondée en 2023 à Hangzhou, en Chine, et a publié son premier modèle d’IA pour les grandes langues plus tard dans l’année.
Son PDG, Liang Wenfeng, avait auparavant cofondé l’un des principaux fonds spéculatifs chinois, High-Flyer, qui se concentre sur les opérations quantitatives basées sur l’IA.
DeepSeek a commencé à attirer l’attention du secteur de l’IA le mois dernier en publiant un nouveau modèle d’IA qui, selon ses dires, était comparable à des modèles similaires d’entreprises américaines telles que le fabricant de ChatGPT, OpenAI.
Et était plus rentable grâce à l’utilisation de puces Nvidia coûteuses pour entraîner le système à partir d’énormes quantités de données.
Le chatbot est devenu plus largement accessible lorsqu’il est apparu sur les boutiques d’applications d’Apple et de Google au début de cette année.
Mais c’est un document de recherche publié la semaine dernière – le jour même de l’investiture du président Donald Trump – qui a déclenché la panique qui a suivi.
Ce document portait sur un autre modèle d’IA de DeepSeek, appelé R1, qui présentait des capacités de « raisonnement » avancées – comme la capacité de repenser son approche d’un problème mathématique – et qui était nettement moins cher qu’un modèle similaire vendu par OpenAI, appelé o1.
« Je n’ai aucune idée de leur rentabilité », a déclaré M. Rasgon. « Mais je pense que les prix ont effrayé les gens.
DeepSeek se concentre sur le développement de LLM open source. Le premier modèle de l’entreprise a été publié en novembre 2023. L’entreprise a itéré plusieurs fois sur son LLM de base et a développé plusieurs variations différentes. Toutefois, ce n’est qu’en janvier 2025, après la publication de son modèle de raisonnement R1, que l’entreprise est devenue mondialement célèbre.
L’entreprise fournit plusieurs services pour ses modèles, notamment une interface web, une application mobile et un accès API.
Comment fonctionne Deepseek ?
Deepseek utilise des algorithmes avancés d’intelligence artificielle et des technologies de pointe de traitement des données pour extraire rapidement et avec précision des informations à partir de vastes ensembles de données.
Mais quel est le principe de fonctionnement de Deepseek et comment ce processus fonctionne-t-il ?
Perspective technique :
Deepseek utilise une série de processus techniques pour analyser les données. Tout d’abord, les requêtes des utilisateurs sont reçues et envoyées aux algorithmes de traitement du langage naturel (NLP) de la plateforme. Ces algorithmes interprètent la requête – non seulement les mots, mais aussi le contexte et la signification. Ensuite, les algorithmes d’apprentissage automatique s’affinent continuellement en analysant les données et les tendances passées afin de fournir des résultats plus précis.
Le processus de traitement des données de Deepseek comprend les éléments suivants :
- Collecte et intégration des données : Deepseek recueille des données à partir de sources multiples (sites web, bases de données, médias sociaux, etc.). Comme ces données se présentent sous différents formats, Deepseek les prétraite pour les rendre significatives.
- Traitement du langage naturel (NLP) : Les requêtes des utilisateurs sont analysées à l’aide d’algorithmes de traitement du langage naturel. Ces algorithmes décodent l’intention, le sens et le contexte de la requête afin de sélectionner les données les plus pertinentes pour obtenir des réponses précises.
- Apprentissage automatique et formation d’algorithmes : Deepseek utilise des techniques d’apprentissage automatique pour améliorer sa précision au fil du temps. La plateforme apprend continuellement de chaque recherche, mettant à jour ses algorithmes pour fournir des résultats plus précis.
- Analyse en temps réel et présentation des résultats : Deepseek a des capacités de traitement de données en temps réel. Les requêtes des utilisateurs sont analysées en quelques secondes, fournissant des résultats instantanés dans différents formats, y compris le texte, les images et l’audio.
Point de vue de l’utilisateur :
Pour les utilisateurs, Deepseek simplifie le processus de recherche et d’analyse des données. Il comprend la requête d’entrée et fournit les résultats les plus pertinents. Les connaissances issues de l’IA guident les utilisateurs vers des informations précises de manière efficace.
Par exemple, si un utilisateur demande « Comment fonctionnent les algorithmes d’intelligence artificielle ? », Deepseek prend en compte non seulement les mots-clés mais aussi l’intention de l’utilisateur. Cela permet de s’assurer que les informations fournies sont exactes et pertinentes en fonction du contexte.
En combinant de puissantes technologies de traitement des données avec des algorithmes d’intelligence artificielle, Deepseek fournit des résultats rapides, précis et significatifs.
À chaque requête, la plateforme apprend et s’améliore, améliorant continuellement l’expérience de l’utilisateur.
À quoi sert Deepseek ?
Deepseek offre aux utilisateurs une série d’avantages significatifs, de l’analyse des données à la recherche rapide d’informations. Mais quel est l’objectif principal de Deepseek, et qui peut bénéficier de cette plateforme ?
L’objectif principal de Deepseek :
Deepseek simplifie l’analyse des données, les recherches rapides et l’accès à des informations précises.
Dans le monde d’aujourd’hui, où les données augmentent de façon exponentielle, trouver la bonne information devient de plus en plus difficile. Deepseek est conçu pour résoudre ce problème. Voici quelques domaines clés dans lesquels Deepseek est utilisé :
- Analyse des Big Data : Deepseek permet aux utilisateurs d’analyser de grands ensembles de données et d’en extraire des informations utiles. En particulier dans les environnements de données complexes, ses algorithmes d’intelligence artificielle et d’apprentissage automatique traitent les données rapidement et avec précision.
- Recherche rapide et accès à l’information : Contrairement aux moteurs de recherche traditionnels, Deepseek ne s’appuie pas uniquement sur la correspondance des mots-clés. Au contraire, il analyse le contexte, le sens et l’intention, fournissant aux utilisateurs des résultats plus précis et personnalisés.
- Résultats personnalisables : Deepseek adapte ses résultats aux besoins spécifiques des utilisateurs. Il offre différentes analyses et perspectives, ce qui en fait un outil puissant pour les entreprises et les chercheurs.
OpenAI vs DeepSeek
DeepSeek représente le dernier défi en date pour OpenAI, qui s’est imposée comme leader de l’industrie avec le lancement de ChatGPT en 2022.
OpenAI a contribué à faire avancer l’industrie de l’IA générative avec sa famille de modèles GPT, ainsi qu’avec sa classe de modèles de raisonnement o1.
Bien que les deux entreprises développent toutes deux des LLM d’IA générative, elles ont des approches différentes.
Critère | OpenAI | DeepSeek |
---|---|---|
Année de fondation | 2015 | 2023 |
Siège social | San Francisco, Californie | Hangzhou, Chine |
Focalisation du développement | Capacités IA générales | Modèles efficaces et open source |
Modèles clés | GPT-4, o1 | DeepSeek-V3, DeepSeek-R1 |
Modèles spécialisés | Dall-E (génération d’images), Whisper (reconnaissance vocale) | DeepSeek Coder (programmation), Janus Pro (modèle de vision) |
Tarification API | o1 : $15 (entrée), $60 (sortie) | DeepSeek-R1 : $0.55 (entrée), $2.19 (sortie) |
Politique open source | Limitée | Majoritairement open source |
Méthode d’entraînement | Fine-tuning supervisé et basé sur des instructions | Apprentissage par renforcement |
Coût de développement | Centaines de millions de dollars pour o1 (estimation) | Moins de 6 millions de dollars pour DeepSeek-R1, selon l’entreprise |
DeepSeek AI est une plateforme open-source et rentable qui fournit des solutions approfondies pour les domaines techniques.
En revanche, ChatGPT se concentre sur la compréhension du langage général et l’interaction avec l’utilisateur, s’adressant ainsi à un public plus large. Les deux plateformes sont puissantes dans leurs domaines respectifs, mais le choix du modèle dépend des besoins et des objectifs spécifiques de l’utilisateur.
Qui peut utiliser Deepseek ?
Deepseek s’adresse à un large public et est une plateforme dont tout le monde peut bénéficier :
- Les particuliers : Les personnes qui ont besoin d’un accès rapide à l’information dans leur vie quotidienne peuvent utiliser Deepseek pour leurs recherches personnelles et leur apprentissage.
- Les entreprises : Deepseek est un excellent outil pour les entreprises qui ont besoin d’une analyse de big data. Les entreprises peuvent mener efficacement des études de marché, des analyses de la clientèle et des évaluations des tendances des produits grâce à Deepseek.
- Chercheurs et universitaires : Les professionnels de l’enseignement qui cherchent à accélérer l’analyse des données et les processus de recherche peuvent tirer parti des technologies de recherche et d’analyse avancées de Deepseek.
Innovations en matière de formation dans DeepSeek
DeepSeek utilise une approche différente de celle utilisée par OpenAI pour former ses modèles R1. La formation a nécessité moins de temps, moins d’accélérateurs d’IA et moins de coûts de développement.
L’objectif de DeepSeek est de parvenir à l’intelligence artificielle générale, et les avancées de l’entreprise en matière de capacités de raisonnement représentent un progrès significatif dans le développement de l’IA.
Dans un document de recherche, DeepSeek décrit les multiples innovations qu’elle a développées dans le cadre du modèle R1, notamment les suivantes :
- Apprentissage par renforcement. DeepSeek a utilisé une approche d’apprentissage par renforcement à grande échelle axée sur les tâches de raisonnement.
- Ingénierie de la récompense. Les chercheurs ont mis au point un système de récompense basé sur des règles pour le modèle qui surpasse les modèles de récompense neuronaux qui sont plus couramment utilisés. L’ingénierie de la récompense est le processus de conception du système d’incitation qui guide l’apprentissage d’un modèle d’IA pendant la formation.
- Distillation. En utilisant des techniques efficaces de transfert de connaissances, les chercheurs de DeepSeek ont réussi à comprimer des capacités dans des modèles comportant seulement 1,5 milliard de paramètres.
- Réseau de comportement émergent. L’innovation de DeepSeek en matière de comportement émergent est la découverte que des modèles de raisonnement complexes peuvent se développer naturellement grâce à l’apprentissage par renforcement sans qu’il soit nécessaire de les programmer explicitement.
Les grands modèles linguistiques de DeepSeek
Depuis la création de l’entreprise en 2023, DeepSeek a publié une série de modèles d’IA générative. À chaque nouvelle génération, l’entreprise s’est efforcée d’améliorer les capacités et les performances de ses modèles :
- DeepSeek Coder. Sorti en novembre 2023, il s’agit du premier modèle open source de l’entreprise conçu spécifiquement pour les tâches liées au codage.
- DeepSeek LLM. Sorti en décembre 2023, il s’agit de la première version du modèle polyvalent de l’entreprise.
- DeepSeek-V2. Sortie en mai 2024, il s’agit de la deuxième version du LLM de l’entreprise, qui met l’accent sur des performances élevées et des coûts de formation réduits.
- DeepSeek-Coder-V2. Lancé en juillet 2024, il s’agit d’un modèle à 236 milliards de paramètres offrant une fenêtre contextuelle de 128 000 jetons, conçu pour les défis de codage complexes.
- DeepSeek-V3. Publié en décembre 2024, DeepSeek-V3 utilise une architecture de mélange d’experts, capable de gérer une série de tâches. Le modèle comporte 671 milliards de paramètres avec une longueur de contexte de 128 000.
- DeepSeek-R1. Sorti en janvier 2025, ce modèle est basé sur DeepSeek-V3 et se concentre sur des tâches de raisonnement avancées, concurrençant directement le modèle o1 d’OpenAI en termes de performances, tout en maintenant une structure de coûts significativement plus faible. Comme DeepSeek-V3, le modèle comporte 671 milliards de paramètres avec une longueur de contexte de 128 000.
- Janus-Pro-7B. Sorti en janvier 2025, Janus-Pro-7B est un modèle de vision capable de comprendre et de générer des images.
Pourquoi il suscite l’inquiétude aux États-Unis
La publication de DeepSeek-R1 a suscité l’inquiétude aux États-Unis et a entraîné une chute des valeurs technologiques sur les marchés boursiers. Le lundi 27 janvier 2025, le Nasdaq Composite a chuté de 3,4 % à l’ouverture du marché, Nvidia reculant de 17 % et perdant environ 600 milliards de dollars de capitalisation boursière.
DeepSeek suscite l’inquiétude aux États-Unis pour plusieurs raisons, dont les suivantes :
- Perturbation des coûts. DeepSeek affirme avoir développé son modèle R1 pour moins de 6 millions de dollars. Ce développement à faible coût menace le modèle économique des entreprises technologiques américaines qui ont investi des milliards dans l’IA. DeepSeek est également moins cher pour les utilisateurs que l’OpenAI.
- Des réalisations techniques malgré les restrictions. L’exportation des accélérateurs d’IA et des puces GPU les plus performants des États-Unis est limitée à la Chine.
- Malgré cela, DeepSeek a démontré que le développement d’une IA de pointe est possible sans accès à la technologie avancée la plus avancée.
- Menace sur le modèle d’entreprise. Contrairement à OpenAI, qui est une technologie propriétaire, DeepSeek est une source ouverte et gratuite, ce qui remet en cause le modèle de revenus des entreprises américaines qui facturent des frais mensuels pour les services d’IA.
- Préoccupations géopolitiques. Basé en Chine, DeepSeek remet en cause la domination technologique des États-Unis dans le domaine de l’IA.
- L’investisseur Marc Andreessen l’a qualifié de « moment Spoutnik » de l’IA, le comparant à la percée de l’Union soviétique dans la course à l’espace dans les années 1950.
Cyberattaque contre DeepSeek
La popularité de DeepSeek n’est pas passée inaperçue aux yeux des cyberattaquants.
Le 27 janvier 2025, DeepSeek a signalé des attaques malveillantes à grande échelle contre ses services, ce qui l’a contraint à limiter temporairement l’inscription de nouveaux utilisateurs.
L’attaque a coïncidé avec le moment où l’application d’assistant IA de DeepSeek a dépassé ChatGPT en tant qu’application la plus téléchargée sur l’App Store d’Apple.
Malgré l’attaque, DeepSeek a maintenu le service pour les utilisateurs existants.
Le problème s’est prolongé jusqu’au 28 janvier, date à laquelle la société a déclaré avoir identifié le problème et déployé un correctif.
DeepSeek n’a pas précisé la nature exacte de l’attaque, bien que de nombreuses spéculations issues de rapports publics aient indiqué qu’il s’agissait d’une forme d’attaque DDoS ciblant son API et sa plateforme de chat en ligne.
Sean Michael Kerner est consultant en informatique, passionné de technologie et bricoleur. Il a installé Token Ring, configuré NetWare et compilé son propre noyau Linux. Il consulte des organisations industrielles et médiatiques sur des questions technologiques.
Conclusion
DeepSeek émerge comme une plateforme de recherche et d’analyse de données innovante, offrant des modèles performants et adaptés aux besoins variés des utilisateurs à travers le monde.
Que ce soit pour l’exploration de données, la programmation, ou l’analyse visuelle, DeepSeek redéfinit la manière dont les données sont traitées et exploitées, tout en mettant un accent particulier sur l’open source et l’efficacité.
Avec des fonctionnalités adaptées aux entreprises, chercheurs et développeurs, DeepSeek continue de se distinguer par son approche unique, offrant des solutions puissantes et accessibles à une large communauté.
Cependant, comme toute technologie de pointe, elle soulève aussi des inquiétudes en matière de sécurité et de régulation, en particulier sur les marchés internationaux.
Néanmoins, il est indéniable que DeepSeek représente une avancée majeure dans l’innovation technologique et le développement des grandes capacités d’IA, avec une vision ambitieuse pour l’avenir.
FAQ
Qu'est-ce que DeepSeek ?
DeepSeek est une plateforme de recherche de données avancée qui utilise des modèles d’intelligence artificielle open source pour traiter et analyser de grandes quantités d’informations à travers différents domaines.
Comment fonctionne DeepSeek ?
DeepSeek repose sur une combinaison de modèles IA efficaces et open source, permettant aux utilisateurs de rechercher, analyser et exploiter des données complexes à l’aide d’outils puissants et accessibles.
Qui peut utiliser DeepSeek ?
Il peut être utilisé par des chercheurs, des entreprises, des développeurs et toute personne ayant besoin d’exploiter des données à grande échelle, tout en bénéficiant de l’open source et de la flexibilité de la plateforme.
Quelle est la différence entre OpenAI et DeepSeek ?
Tandis qu’OpenAI se concentre sur des modèles IA polyvalents comme GPT, DeepSeek se distingue par sa spécialisation dans l’analyse de données et ses modèles open source adaptés à des usages spécifiques tels que la programmation et la vision.
DeepSeek présente-t-il des risques en matière de cybersécurité ?
Comme toute technologie avancée, DeepSeek fait face à des risques de cyberattaques. Cependant, l’entreprise met en place des mesures de sécurité robustes pour protéger les données des utilisateurs.
Pourquoi DeepSeek suscite-t-il des inquiétudes aux États-Unis ?
L’impact de DeepSeek sur la collecte et l’exploitation des données soulève des préoccupations en matière de régulation, de sécurité et de l’influence que la plateforme pourrait exercer sur les marchés américains.
Comment DeepSeek se distingue-t-il des autres plateformes d'IA ?
DeepSeek se distingue par son approche open source et ses modèles spécialisés adaptés aux besoins spécifiques des utilisateurs, allant des applications de programmation à l’analyse visuelle et au traitement du langage naturel.
Sébastian Magni est un Spécialiste du SEO et Inbound Marketing chez @LCM