
OpenAI affirme avoir trouv� des preuves que la start-up chinoise DeepSeek a utilis� les mod�les propri�taires de l'entreprise am�ricaine pour entra�ner son propre concurrent � code source ouvert, alors que les inqui�tudes grandissent quant � une violation potentielle de la propri�t� intellectuelle. L'�diteur de ChatGPT a d�clar� au Financial Times qu'il avait constat� des preuves de "distillation", qu'il soup�onne �tre le fait de DeepSeek.
La sortie de DeepSeek R1 a provoqu� une onde de choc dans la communaut� de l'IA, bouleversant les hypoth�ses sur ce qui est n�cessaire pour atteindre des performances d'IA de pointe. Ce mod�le open-source correspondrait � l'o1 d'OpenAI pour seulement 3 � 5 % du co�t selon le benchmark de la startup �ponyme. Le document technique du mod�le r�v�le que DeepSeek s'est d�lib�r�ment �cart�e du processus conventionnel de mise au point supervis�e (SFT pour supervised fine-tuning) et s'est appuy� sur l'apprentissage par renforcement (RL) pour atteindre ces performances.
Cependant, OpenAI vient d'affirmer que la startup d'intelligence artificielle (IA) DeepSeek pourrait avoir entra�n� son mod�le R1 open-source en utilisant la technologie propri�taire d'OpenAI. En d'autres termes, la start-up chinoise n'aurait pas tout construit � partir de z�ro, mais se serait plut�t appuy�e sur les mod�les d'OpenAI pour d�velopper son concurrent. Selon le Financial Times, l'�diteur de ChatGPT, bas� � San Francisco, a constat� des preuves de "distillation", c'est-�-dire le processus de transfert de connaissances d'un grand mod�le � un plus petit. Il s'agirait donc d'une violation des conditions d'utilisation d'OpenAI.
Le nouveau � tsar � de l'IA et des crypto-monnaies du pr�sident am�ricain Donald Trump, David Sacks, a �galement d�clar� : "Il existe des preuves substantielles que DeepSeek a distill� des connaissances � partir des mod�les d'OpenAI, et je ne pense pas qu'OpenAI soit tr�s heureux � ce sujet. Je pense que l'une des choses que vous verrez au cours des prochains mois, c'est que nos principales entreprises d'IA prendront des mesures pour essayer d'emp�cher la distillation."
👀 DAVID SACKS: �There is substantial evidence that what DeepSeek did here is they distilled the knowledge out of OpenAI�s models, and I don�t think OpenAI is very happy about this.� pic.twitter.com/IYXKwBbUh1
— Chief Nerd (@TheChiefNerd) January 29, 2025
La distillation des connaissances a �t� utilis�e � bon escient dans toutes sortes de domaines, du traitement du langage naturel et de la reconnaissance vocale � la reconnaissance d'images et � la d�tection d'objets. Mais ces derni�res ann�es, elle est devenue particuli�rement importante pour les grands mod�les de langage (LLM). En ce qui concerne les LLM, la distillation s'est av�r�e �tre un moyen important de transmettre les comp�tences avanc�es des mod�les propri�taires de haut niveau � des mod�les open-source plus petits et plus accessibles. Dans ce cas, DeepSeek a �t� accus� de violation de la propri�t� intellectuelle.
Une source a d�clar� au Financial Times: "Le probl�me se pose lorsque vous [retirez le mod�le de la plateforme et] le faites pour cr�er votre propre mod�le � vos propres fins."
Cependant, OpenAI n'est pas vraiment � l'abri des critiques en mati�re de propri�t� intellectuelle. L'entreprise fait actuellement l'objet d'un proc�s, men� par le New York Times, dans lequel les entreprises de m�dias l'accusent d'utiliser leurs donn�es sans autorisation. Une �tude avait m�me r�v�l� qu'OpenAI a mis en place un m�canisme pour �viter que son mod�le de g�n�ration de texte ChatGPT ne r�v�le qu�il a �t� entra�n� sur des livres prot�g�s par le droit d�auteur.
En outre, OpenAI a �galement reconnu qu�il est impossible de cr�er des outils comme ChatGPT sans s�appuyer sur des contenus sous copyright. L'�diteur de ChatGPT avait notammanet d�clar� : "�tant donn� que le droit d'auteur couvre aujourd'hui pratiquement toutes les formes d'expression humaine, il serait impossible d�entra�ner les meilleurs mod�les d'IA d'aujourd'hui sans utiliser des documents prot�g�s par le droit d'auteur. Limiter les donn�es d'entra�nement ... ne permettrait pas d'obtenir des syst�mes d'IA r�pondant aux besoins des citoyens d'aujourd'hui."
Pour rappel, la publication par DeepSeek de son mod�le R1 a provoqu� une onde de choc sur les march�s financiers mondiaux. L'entreprise chinoise semble avoir obtenu des r�sultats comparables � ceux de ses plus grands rivaux, bien qu'elle ait utilis� beaucoup moins d'argent et de puissance de calcul. Le PDG d'OpenAI, Sam Altman, a applaudi publiquement le mod�le R1 open-source, le qualifiant d'"impressionnant".
Cela a amen� les investisseurs � reconsid�rer l'une des principales hypoth�ses � l'origine de la r�cente flamb�e des march�s boursiers induite par l'IA. Les plus grands acteurs de l'IA, ou "hyperscalers", ont besoin d'�normes quantit�s de puissance de calcul pour rester en t�te. L'incertitude a frapp� Nvidia de plein fouet, faisant subir � son action la plus forte baisse de valeur boursi�re de l'histoire en une seule journ�e le lundi 27 janvier, bien qu'elle ait r�ussi � regagner un peu de terrain le mardi.
N�anmoins, ces derni�res all�gations � l'encontre de DeepSeek pourraient ajouter une nouvelle couche � la bataille technologique en cours entre les �tats-Unis et la Chine, rendant les choses encore plus compliqu�es.
Source : The Financial Times
Et vous ?


Voir aussi :



Vous avez lu gratuitement 0 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer � vous proposer des publications.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer � vous proposer des publications.