Recherche de site Web

Qu’est-ce que DeepSeek AI ? Est-ce sûr ? Voici tout ce que vous devez savoir


Les modèles de la startup chinoise sont-ils exaltants, disruptifs ou menaçants ? Cela dépend de votre point de vue. Voici ce que les experts pensent que vous devriez savoir.

Quelques semaines seulement après le début de sa nouvelle renommée, la start-up chinoise d’IA DeepSeek évolue à une vitesse vertigineuse, renversant ses concurrents et suscitant des conversations sur les vertus des logiciels open source.

Cependant, de nombreux problèmes de sécurité ont fait surface à propos de l’entreprise, ce qui a incité des organisations privées et gouvernementales à interdire l’utilisation de DeepSeek. Voici ce que vous devez savoir.

Qu’est-ce que DeepSeek ?

Fondée par Liang Wenfeng en mai 2023 (et donc même pas âgée de deux ans), la startup chinoise a défié les entreprises d’IA établies avec son approche open-source. Selon Forbes, l'avantage de DeepSeek pourrait résider dans le fait qu'il n'est financé que par High-Flyer, un fonds spéculatif également géré par Wenfeng, ce qui donne à l'entreprise un modèle de financement qui soutient la croissance rapide et la recherche.

La startup a fait des vagues en janvier lorsqu'elle a publié la version complète de R1, son modèle de raisonnement open-source qui peut surpasser l'o1 d'OpenAI. Peu de temps après, les téléchargements sur l'App Store de l'assistant IA de DeepSeek - qui exécute la V3, un modèle que DeepSeek a lancé en décembre - ont dépassé ChatGPT, auparavant l'application gratuite la plus téléchargée. DeepSeek R1 s'est même hissé à la troisième place du classement général de la Chatbot Arena de HuggingFace, se battant avec plusieurs modèles Gemini et ChatGPT-4o ; dans le même temps, DeepSeek a lancé un modèle prometteur de nouvelle image.

La capacité de l'entreprise à créer des modèles réussis en optimisant stratégiquement les puces plus anciennes - résultat de l'interdiction d'exportation des puces fabriquées aux États-Unis, y compris Nvidia - et en répartissant les charges de requêtes entre les modèles pour plus d'efficacité est impressionnante par rapport aux normes de l'industrie.

Qu’est-ce que DeepSeek R1 ?

Sorti dans son intégralité le 21 janvier, R1 est le modèle de raisonnement phare de DeepSeek, dont les performances sont égales ou supérieures au modèle o1 d'OpenAI sur plusieurs points de référence en mathématiques, en codage et en raisonnement.

Construit sur la V3 et basé sur Qwen d'Alibaba et Llama de Meta, ce qui rend R1 intéressant, c'est que, contrairement à la plupart des autres modèles haut de gamme des géants de la technologie, il est open source, ce qui signifie que tout le monde peut le télécharger et l'utiliser. Cela dit, DeepSeek n'a pas divulgué l'ensemble de données d'entraînement de R1. Jusqu’à présent, tous les autres modèles qu’il a sortis sont également open source.

DeepSeek est moins cher que les modèles américains comparables. À titre de référence, l’accès à l’API R1 commence à 0,14 $pour un million de jetons, une fraction des 7,50 $facturés par OpenAI pour le niveau équivalent.

DeepSeek affirme dans un document de recherche de l'entreprise que son modèle V3, qui peut être comparé à un modèle de chatbot standard comme Claude, a coûté 5,6 millions de dollars à former, un chiffre qui circule (et est contesté) comme le coût total de développement du modèle. Comme l'a rapporté Reuters, certains experts de laboratoire pensent que l'article de DeepSeek ne fait référence qu'à la dernière formation pour la V3, et non à l'ensemble de son coût de développement (qui ne représenterait qu'une fraction de ce que les géants de la technologie ont dépensé pour construire des modèles compétitifs). D'autres experts suggèrent que les coûts de DeepSeek n'incluent pas les coûts antérieurs d'infrastructure, de R&D, de données et de personnel.

L'un des inconvénients qui pourrait avoir un impact sur la concurrence à long terme du modèle avec o1 et les alternatives fabriquées aux États-Unis est la censure. Les modèles chinois incluent souvent des blocs sur certains sujets, ce qui signifie que, bien qu'ils fonctionnent de manière comparable à d'autres modèles, ils peuvent ne pas répondre à certaines requêtes (voir comment l'assistant IA de DeepSeek répond aux questions sur la place Tiananmen et Taïwanici). À mesure que l'utilisation de DeepSeek augmente, certains craignent que les garde-fous chinois stricts et les biais systémiques de ses modèles ne soient intégrés dans tous les types d'infrastructures.

Cela dit, vous pouvez accéder à des versions non censurées et basées aux États-Unis de plateformes DeepSeekthrough comme Perplexity. Ces plateformes ont supprimé les poids de censure de DeepSeek et l'exécutent sur des serveurs locaux pour éviter les problèmes de sécurité.

En décembre, Tiernan Ray de ZDNET a comparé la capacité de R1-Lite à expliquer sa chaîne de pensée à celle de o1, et les résultats ont été mitigés. Cela dit, l'assistant IA de DeepSeek révèle son fil de pensée à l'utilisateur lors des requêtes, une expérience nouvelle pour de nombreux utilisateurs de chatbots étant donné que ChatGPT n'externalise pas son raisonnement.

Bien sûr, tous les modèles populaires sont livrés avec des arrière-plans de red-teaming, des directives communautaires et des garde-fous de contenu. Cependant, au moins à ce stade, il est peu probable que les chatbots fabriqués aux États-Unis s’abstiennent de répondre à des questions sur des événements historiques.

Quelles sont les préoccupations en matière de confidentialité et de sécurité ?

Les inquiétudes concernant la confidentialité des données qui ont circulé sur TikTok - l’application de médias sociaux appartenant à des Chinois, aujourd’hui quelque peu interdite aux États-Unis - surgissent également autour de DeepSeek.

Plus tôt ce mois-ci, le PDG de Feroot Security, Ivan Tsarynny, a déclaré à ABC que son entreprise avait découvert « des liens directs vers des serveurs et des entreprises en Chine qui sont sous le contrôle du gouvernement chinois », ce qu’il a dit qu’ils « n’ont jamais vu dans le passé ».

Après avoir déchiffré une partie du code de DeepSeek, Feroot a découvert une programmation cachée qui peut envoyer des données utilisateur - y compris des informations d'identification, des requêtes et des activités en ligne - à China Mobile, une société de télécommunications gérée par le gouvernement chinois qui a été interdite d'opérer aux États-Unis depuis 2019 pour des raisons de sécurité nationale.

NowSecure a ensuite recommandé aux organisations d'« interdire » l'utilisation de l'application mobile de DeepSeek après avoir découvert plusieurs défauts, notamment des données non cryptées (ce qui signifie que toute personne surveillant le trafic peut les intercepter) et un stockage de données médiocre.

La semaine dernière, le cabinet d’études Wiz a découvert qu’une base de données interne de DeepSeek était accessible au public « quelques minutes » après avoir effectué un contrôle de sécurité. La base de données « entièrement ouverte et non authentifiée » contenait des historiques de chat, des clés API d’utilisateurs et d’autres données sensibles.

« Plus important encore, l'exposition a permis un contrôle total de la base de données et une élévation potentielle des privilèges au sein de l'environnement DeepSeek, sans aucun mécanisme d'authentification ou de défense vis-à-vis du monde extérieur », explique le rapport de Wiz.

Selon Wired, qui a initialement publié l’étude, bien que Wiz n’ait pas reçu de réponse de DeepSeek, la base de données semble avoir été supprimée dans les 30 minutes suivant la notification de Wiz à l’entreprise. On ne sait pas combien de temps il a été accessible ou si une autre entité l'a découvert avant qu'il ne soit démantelé.

Même sans cette évolution alarmante, la politique de confidentialité de DeepSeek soulève quelques drapeaux rouges. Il stipule : « Les informations personnelles que nous recueillons auprès de vous peuvent être stockées sur un serveur situé en dehors du pays où vous vivez. Nous stockons les informations que nous recueillons dans des serveurs sécurisés situés en République populaire de Chine.

La politique précise que DeepSeek recueille de nombreuses informations, y compris, mais sans s’y limiter :

  • Adresse IP, identifiants uniques de l’appareil et cookies
  • Date de naissance (le cas échéant), nom d’utilisateur, adresse e-mail et/ou numéro de téléphone, et mot de passe
  • Votre saisie de texte ou d’audio, votre invite, vos fichiers téléchargés, vos commentaires, votre historique de chat ou tout autre contenu que vous fournissez à notre modèle et à nos services
  • Une preuve d’identité ou d’âge, des commentaires ou des demandes de renseignements sur votre utilisation du Service [Si vous contactez DeepSeek]

La politique poursuit : « Lorsque nous transférons des informations personnelles en dehors du pays où vous vivez, y compris pour une ou plusieurs des finalités énoncées dans la présente politique, nous le ferons conformément aux exigences des lois applicables en matière de protection des données. » La politique ne mentionne pas la conformité au RGPD.

« Les utilisateurs doivent être conscients que toutes les données partagées avec la plate-forme pourraient être soumises à l'accès du gouvernement en vertu des lois chinoises sur la cybersécurité, qui obligent les entreprises à fournir un accès aux données à la demande des autorités », a déclaré Adrianus Warmenhoven, membre du conseil consultatif de sécurité de NordVPN, à ZDNET par e-mail.

Selon certains observateurs, le fait que R1 soit open source signifie une transparence accrue, permettant aux utilisateurs d'inspecter le code source du modèle à la recherche de signes d'activité liée à la confidentialité.

Cependant, DeepSeek a également publié des versions plus petites de R1, qui peuvent être téléchargées et exécutées localement pour éviter tout souci de renvoi de données à l’entreprise (par opposition à l’accès au chatbot en ligne).

Tous les chatbots, y compris ChatGPT, collectent un certain degré de données utilisateur lorsqu’ils sont interrogés via le navigateur.

DeepSeek AI est-il sûr ?

Les chercheurs en sécurité de l’IA craignent depuis longtemps que de puissants modèles open source puissent être appliqués de manière dangereuse et non réglementée une fois dans la nature. Des tests effectués par la société de sécurité d’IA Chatterbox ont révélé que DeepSeek R1 présentait des « problèmes de sécurité à tous les niveaux ».

À des degrés divers, les entreprises américaines d’IA emploient une sorte d’équipe de surveillance de la sécurité. DeepSeek n'a pas annoncé s'il avait une équipe de recherche sur la sécurité et n'a pas répondu à la demande de commentaires de ZDNET sur la question.

« La plupart des entreprises continueront à se battre pour construire l'IA la plus puissante possible, quels que soient les risques, et verront l'efficacité algorithmique accrue comme un moyen d'atteindre plus rapidement des performances plus élevées », a déclaré Peter Slattery, chercheur de l'équipe FutureTech du MIT qui a dirigé son projet Risk Repository. « Cela nous laisse encore moins de temps pour relever les défis de sécurité, de gouvernance et de société qui découleront des systèmes d’IA de plus en plus avancés. »

« La percée de DeepSeek en matière d'efficacité de la formation signifie également que nous devrions bientôt nous attendre à voir un grand nombre de « wrappers » locaux et spécialisés - des applications construites sur le moteur DeepSeek R1 - qui présenteront chacune leurs propres risques pour la vie privée, et qui pourraient chacune être utilisées à mauvais escient si elles tombaient entre de mauvaises mains », a ajouté Ryan Fedasiuk. directeur de la gouvernance de l’IA aux États-Unis chez The Future Society, une organisation à but non lucratif spécialisée dans la politique de l’IA.

DeepSeek est-il plus économe en énergie ?

Certains analystes notent que le modèle de calcul à faible portance de DeepSeek est plus économe en énergie que celui des géants de l'IA construits aux États-Unis.

« Le nouveau modèle d'IA de DeepSeek utilise probablement moins d'énergie pour s'entraîner et fonctionner que les modèles de concurrents plus importants », a déclaré Slattery. « Cependant, je doute que cela marque le début d’une tendance à long terme à la baisse de la consommation d’énergie. La puissance de l'IA provient des données, des algorithmes et du calcul, qui reposent sur des puces en constante amélioration. Lorsque les développeurs ont déjà trouvé des moyens d’être plus efficaces, ils ont généralement réinvesti ces gains dans la fabrication de modèles encore plus grands et plus puissants, plutôt que de réduire la consommation globale d’énergie.

« DeepSeek n'est pas la seule entreprise d'IA à avoir réalisé des gains extraordinaires en matière d'efficacité informatique. Au cours des derniers mois, les sociétés américaines Anthropic et Google Gemini ont affiché des améliorations similaires de leurs performances », a déclaré M. Fedasiuk.

« Les réalisations de DeepSeek sont remarquables en ce sens qu'elles semblent avoir conçu de manière indépendante des percées qui promettent de rendre les grands modèles de langage beaucoup plus efficaces et moins coûteux, plus tôt que ce à quoi de nombreux professionnels de l'industrie s'attendaient - mais dans un domaine aussi dynamique que l'IA, il est difficile de prédire combien de temps l'entreprise sera en mesure de se prélasser sous les feux de la rampe. »

Comment DeepSeek affectera-t-il l’industrie de l’IA ?

Le succès de R1 met en évidence un changement radical dans l'IA qui pourrait permettre aux petits laboratoires et aux chercheurs de créer des modèles compétitifs et de diversifier les options. Par exemple, les organisations qui ne disposent pas du financement ou du personnel d’OpenAI peuvent télécharger R1 et l’affiner pour concurrencer des modèles comme o1. Juste avant la sortie de R1, des chercheurs de l'UC Berkeley ont créé un modèle open source comparable à o1-preview, une première version de o1, en seulement 19 heures et pour environ 450 $.

Étant donné à quel point les investissements dans l’IA sont devenus exorbitants, de nombreux experts spéculent que cette évolution pourrait faire éclater la bulle de l’IA (le marché boursier a certainement paniqué). Certains voient dans le succès de DeepSeek une démystification de l'idée qu'un développement de pointe signifie de grands modèles et de grandes dépenses. Il présente également Stargate, une initiative d'infrastructure de 500 milliards de dollars menée par plusieurs géants de l'IA, sous un nouveau jour, créant des spéculations sur la question de savoir si l'IA compétitive nécessite l'énergie et l'échelle des centres de données proposés par l'initiative.

L'ascension de DeepSeek intervient à un moment critique pour les relations technologiques sino-américaines, quelques jours seulement après l'entrée en vigueur partielle de l'interdiction de TikTok. Ironiquement, DeepSeek expose dans un langage clair les problèmes de sécurité que les États-Unis ont eu du mal à prouver à propos de TikTok dans leurs efforts prolongés pour promulguer l’interdiction.

Quels pays interdisent DeepSeek ?

Plusieurs agences américaines, dont la NASA et la Marine, ont déjà interdit DeepSeek sur les technologies fournies par le gouvernement à leurs employés, et les législateurs tentent d'interdire l'application de tous les appareils gouvernementaux, ce que l'Australie et Taïwan ont déjà mis en œuvre. La Corée du Sud a interdit les nouveaux téléchargements de l'application en raison de l'incapacité récente de DeepSeek à se conformer aux protections locales des données. L’Italie enquête sur l’entreprise pour des préoccupations concernant la conformité au RGPD.