IdentifiantMot de passe
Loading...
Mot de passe oubli� ?Je m'inscris ! (gratuit)

Vous �tes nouveau sur Developpez.com ? Cr�ez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et �tre connect� pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Cr�ez-en un en quelques instants, c'est enti�rement gratuit !

Si vous disposez d�j� d'un compte et qu'il est bien activ�, connectez-vous � l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oubli� ?
Cr�er un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

OpenAI a trouv� des preuves que la start-up chinoise DeepSeek a utilis� les mod�les propri�taires d'OpenAI pour former son propre mod�le open-source
En utilisant la technique de "distillation"

Le , par Jade Emy

47PARTAGES

11  0 
OpenAI a trouv� des preuves que la start-up chinoise DeepSeek a utilis� les mod�les propri�taires d'OpenAI pour former son propre mod�le open-source, en utilisant la technique de "distillation".

OpenAI affirme avoir trouv� des preuves que la start-up chinoise DeepSeek a utilis� les mod�les propri�taires de l'entreprise am�ricaine pour entra�ner son propre concurrent � code source ouvert, alors que les inqui�tudes grandissent quant � une violation potentielle de la propri�t� intellectuelle. L'�diteur de ChatGPT a d�clar� au Financial Times qu'il avait constat� des preuves de "distillation", qu'il soup�onne �tre le fait de DeepSeek.

La sortie de DeepSeek R1 a provoqu� une onde de choc dans la communaut� de l'IA, bouleversant les hypoth�ses sur ce qui est n�cessaire pour atteindre des performances d'IA de pointe. Ce mod�le open-source correspondrait � l'o1 d'OpenAI pour seulement 3 � 5 % du co�t selon le benchmark de la startup �ponyme. Le document technique du mod�le r�v�le que DeepSeek s'est d�lib�r�ment �cart�e du processus conventionnel de mise au point supervis�e (SFT pour supervised fine-tuning) et s'est appuy� sur l'apprentissage par renforcement (RL) pour atteindre ces performances.

Cependant, OpenAI vient d'affirmer que la startup d'intelligence artificielle (IA) DeepSeek pourrait avoir entra�n� son mod�le R1 open-source en utilisant la technologie propri�taire d'OpenAI. En d'autres termes, la start-up chinoise n'aurait pas tout construit � partir de z�ro, mais se serait plut�t appuy�e sur les mod�les d'OpenAI pour d�velopper son concurrent. Selon le Financial Times, l'�diteur de ChatGPT, bas� � San Francisco, a constat� des preuves de "distillation", c'est-�-dire le processus de transfert de connaissances d'un grand mod�le � un plus petit. Il s'agirait donc d'une violation des conditions d'utilisation d'OpenAI.

Le nouveau � tsar � de l'IA et des crypto-monnaies du pr�sident am�ricain Donald Trump, David Sacks, a �galement d�clar� : "Il existe des preuves substantielles que DeepSeek a distill� des connaissances � partir des mod�les d'OpenAI, et je ne pense pas qu'OpenAI soit tr�s heureux � ce sujet. Je pense que l'une des choses que vous verrez au cours des prochains mois, c'est que nos principales entreprises d'IA prendront des mesures pour essayer d'emp�cher la distillation."



La distillation des connaissances a �t� utilis�e � bon escient dans toutes sortes de domaines, du traitement du langage naturel et de la reconnaissance vocale � la reconnaissance d'images et � la d�tection d'objets. Mais ces derni�res ann�es, elle est devenue particuli�rement importante pour les grands mod�les de langage (LLM). En ce qui concerne les LLM, la distillation s'est av�r�e �tre un moyen important de transmettre les comp�tences avanc�es des mod�les propri�taires de haut niveau � des mod�les open-source plus petits et plus accessibles. Dans ce cas, DeepSeek a �t� accus� de violation de la propri�t� intellectuelle.

Une source a d�clar� au Financial Times: "Le probl�me se pose lorsque vous [retirez le mod�le de la plateforme et] le faites pour cr�er votre propre mod�le � vos propres fins."

Cependant, OpenAI n'est pas vraiment � l'abri des critiques en mati�re de propri�t� intellectuelle. L'entreprise fait actuellement l'objet d'un proc�s, men� par le New York Times, dans lequel les entreprises de m�dias l'accusent d'utiliser leurs donn�es sans autorisation. Une �tude avait m�me r�v�l� qu'OpenAI a mis en place un m�canisme pour �viter que son mod�le de g�n�ration de texte ChatGPT ne r�v�le qu�il a �t� entra�n� sur des livres prot�g�s par le droit d�auteur.

En outre, OpenAI a �galement reconnu qu�il est impossible de cr�er des outils comme ChatGPT sans s�appuyer sur des contenus sous copyright. L'�diteur de ChatGPT avait notammanet d�clar� : "�tant donn� que le droit d'auteur couvre aujourd'hui pratiquement toutes les formes d'expression humaine, il serait impossible d�entra�ner les meilleurs mod�les d'IA d'aujourd'hui sans utiliser des documents prot�g�s par le droit d'auteur. Limiter les donn�es d'entra�nement ... ne permettrait pas d'obtenir des syst�mes d'IA r�pondant aux besoins des citoyens d'aujourd'hui."


Pour rappel, la publication par DeepSeek de son mod�le R1 a provoqu� une onde de choc sur les march�s financiers mondiaux. L'entreprise chinoise semble avoir obtenu des r�sultats comparables � ceux de ses plus grands rivaux, bien qu'elle ait utilis� beaucoup moins d'argent et de puissance de calcul. Le PDG d'OpenAI, Sam Altman, a applaudi publiquement le mod�le R1 open-source, le qualifiant d'"impressionnant".

Cela a amen� les investisseurs � reconsid�rer l'une des principales hypoth�ses � l'origine de la r�cente flamb�e des march�s boursiers induite par l'IA. Les plus grands acteurs de l'IA, ou "hyperscalers", ont besoin d'�normes quantit�s de puissance de calcul pour rester en t�te. L'incertitude a frapp� Nvidia de plein fouet, faisant subir � son action la plus forte baisse de valeur boursi�re de l'histoire en une seule journ�e le lundi 27 janvier, bien qu'elle ait r�ussi � regagner un peu de terrain le mardi.

N�anmoins, ces derni�res all�gations � l'encontre de DeepSeek pourraient ajouter une nouvelle couche � la bataille technologique en cours entre les �tats-Unis et la Chine, rendant les choses encore plus compliqu�es.

Source : The Financial Times

Et vous ?

Pensez-vous que ces accusations sont cr�dibles ou pertinentes ?
Quel est votre avis sur le sujet ?

Voir aussi :

Sam Altman, PDG d'OpenAI, a qualifi� DeepSeek de � mod�le impressionnant �, apr�s que la sortie de DeepSeek R1 a provoqu� une onde de choc dans la communaut� de l'IA

Meta aurait mis en place des � cellules de crise � compos�es d'ing�nieurs pour comprendre comment l'IA de DeepSeek peut battre tous les autres avec une fraction du prix

Des chercheurs chinois viennent de percer les secrets de l'AGI d'OpenAI, avec un plan d�taill� qui r�v�le comment recr�er les capacit�s de raisonnement du mod�le o1 d'OpenAI � partir de z�ro
Vous avez lu gratuitement 0 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer � vous proposer des publications.

Une erreur dans cette actualit� ? Signalez-nous-la !

Avatar de OuftiBoy
Membre �prouv� https://www.developpez.com
Le 29/01/2025 � 18:28


Il est quand m�me sans g�ne ce Altman.

Il trouve normal d'utiliser des donn�es ayant un droit d'auteur gratuitement pour alimenter son IA, mais si on se sert de son droit d'auteur � lui, il est pas content le Monsieur. C'est un peu l'hopital qui se fout de la charit� .

C'est un peu la jungle avec les IA. Si je demande � une IA de me montrer en direct un match de foot, je "bypass" les droits d'auteurs de la "cha�ne TV" ayant ch�rement payer ces droits, et cela serait l�gal ? Et si c'est ill�gale, pourquoi le reste de ce qui est pomp� et recracher par l'IA ne le serait-il pas ?

Si je filme le match (qui sort d'une "machine", ici la TV) avec une super cam�ra (une autre machine) et que je diffuse cela en direct streaming sur "Internet" (qui repose au final sur des machines), c'est donc l�gal ?

Bref, les grands de ce monde vont arranger tout cela � leur prochaine r�union � Davos, et tous les autres seront raquet�s. Deux poids, deux mesures. Les (quelques) forts d'un c�t� et la masse des faibles gueux de l'autre.

Elle est pas belle la vie .

B�V et Peace & Love.
7  0 
Avatar de xbemous
Nouveau Candidat au Club https://www.developpez.com
Le 03/07/2025 � 19:20
Toujours les m�mes craintes tandis que les ricains transf�rent � la sauce NSA, personne ne bronche. Mais d�s que c'est la chine, tout le monde hurle.
7  0 
Avatar de noremorse
Membre actif https://www.developpez.com
Le 29/01/2025 � 20:48
Malgr� cela, la somme d�pens�e par DeepSeek reste largement inf�rieure aux montants faramineux que comptent d�penser les occidentaux
6  0 
Avatar de
https://www.developpez.com
Le 29/01/2025 � 22:57
Citation Envoy� par Developpez.com

Mais les analystes de SemiAnalysis ont tenu � apporter quelques nuances aux d�clarations de DeepSeek. SemiAnalysis est une soci�t� ind�pendante de recherche et d'analyse sp�cialis�e dans les secteurs des semiconducteurs et de l'IA.
Citation Envoy� par SemiAnalysis

All matters arising out of or relating to these Terms are governed by and construed in accordance with the internal laws of the State of Florida without giving effect to any choice or conflict of law provision or rule (whether of the State of Florida or any other jurisdiction) that would cause the application of the laws of any jurisdiction other than those of the State of Florida.
Entreprise am�ricaine 100% ind�pendante et impartiale. Mais tout � fait!
5  0 
Avatar de OrthodoxWindows
Membre expert https://www.developpez.com
Le 02/02/2025 � 17:47
Outre le domaine de la s�curit�, DeepSeek est accus� d'appliquer une censure stricte sur des sujets politiquement sensibles en Chine. Les utilisateurs ont vu le chatbot chinois r�pondre, puis se censurer en temps r�el. Pour certains critiques, il s'agit d'un aper�u saisissant du contr�le exerc� par la Chine sur l'information, mais d'autres rappellent que n'importe qui peut t�l�charger le mod�le open source de DeepSeek et l'adapter pour supprimer les restrictions de P�kin.
Ce qui veut aussi dire que n'importe qui peu t�l�charger n'importe quel mod�le open-source pour supprimer les restrictions de s�curit�, y compris concernant ce que Cisco nomme "six cat�gories de comportements nuisibles, dont la cybercriminalit�, la d�sinformation, les activit�s ill�gales et le pr�judice g�n�ral"

De plus, DeepSeek n'est pas le premier mod�le open-source � �tre sorti non-censur� l� dessus. Il y a d�j� eu plusieurs mod�les de Mistral.
Pourtant, il me semble que la criminalit� n'a pas sensiblement augment� de part le monde de mani�re significative, la cybercriminalit� non plus, et la Terre ne s'est pas arr�t�e de tourner... Du coup, l'on est s�rieusement en droit de se demander si Cisco n'exag�re pas �norm�ment en parlant de r�sultats "alarmants".
Et cela en prenant en compte le fait que de toute fa�on, � partir du moment o� un mod�le est open-source, n'importe qui peu le modifier...

Le vrai danger de l'IA ne sera pas li� au p�quin lambda qui veut g�n�rer n'importe quel instruction ill�gale sur son ordi ou son portable. Les deux vrais danger de l'IA sont les entreprises qui cherchent � s�approprier � elle-seule certains algorithmes, afin de rendre d�pendant des milliers de personnes et d'entreprises dans le monde. Et surtout, que des r�gimes autoritaires, voir totalitaires, s'en servent pour contr�ler et surveiller les gens, censurer du contenu dynamiquement, et faire la guerre avec des robots tueurs.
4  0 
Avatar de Anselme45
Membre extr�mement actif https://www.developpez.com
Le 14/03/2025 � 18:47
Marrant.. J'ai toujours cru que l'�conomie am�ricaine �tait en t�te du capitalisme dont la r�gle premi�re est "que le meilleur gagne!"

L'IA am�ne donc un nouveau mod�le de capitalisme aux USA? Genre cour d'�cole "Papa, papa, mon petit camarade pisse plus haut que moi contre le mur de l'�cole... J'exige que tu interviennes aupr�s du directeur de l'�cole pour qu'il me donne un avantage en me fournissant un escabeau ou une �chelle"

C'est tout simplement path�tique!
3  0 
Avatar de RenarddeFeu
Membre averti https://www.developpez.com
Le 22/04/2025 � 1:43
L'IA a cela de commun avec les SGBD qu'il serait idiot de se fier aveugl�ment � un mod�le ferm�. C'est l'assurance de se retrouver � la merci de l'�diteur totalement libre d'augmenter ses tarifs � discr�tion.
3  0 
Avatar de NotABread
Membre actif https://www.developpez.com
Le 29/01/2025 � 15:54
Je suis loin d'�tre juriste ni d'avoir les d�tails techniques derri�res tout �a, mais puisque les sorties des IA sont la propri�t� de personne, et que l'utilisation de contenu sous droit d'auteur pour la formation de r�seau de neurone est du fair use d'apr�s OpenAI:
- comment la distillation rel�ve dans ce cas est une violation du droit d'auteur ? La sortie est libre de droit
- selon les principes d'OpenAI, pourquoi la distillation ne serait pas du fair use ?
- est-ce que refuser la distillation n'est pas un obstacle � la mission annonc�e d'OpenAI (l�av�nement d'une AIG) ?
- quelles sont les preuves OpenAI et peut-on d�montrer que ce n'est pas li� � un jeu d'entrainement similaire ? Avec la reproduction ouverte de DeepSeck, il devrait �tre possible de trouver ces preuves, non ?
2  0 
Avatar de Garfaz
Membre du Club https://www.developpez.com
Le 29/01/2025 � 18:11
un journal fait un article
OpenAI r�cup�re l'article pour son entrainement
Deepseek qui s'entraine sur openai

je vois pas ou est le probl�me
2  0 
Avatar de
https://www.developpez.com
Le 03/02/2025 � 8:34
D'abord DeepSeek est critiqu� pour sa censure, ensuite pour le fait qu'il n'est pas assez s�curis� contre son d�tournement.

Que DeepSeek puisse �tre jailbreak� n'est pas mon probl�me ni celui d'une majorit� d'utilisateurs, qui ne savent m�me pas de quoi il s'agit. Et ce ne sont pas les armes qui font les criminels, mais ceux qui les utilisent � mauvais dessein.

Par ailleurs, le fait que la Chine censure des �l�ments de sa politique interne dans DeepSeek n'a rien de surprenant ni d'ill�gal. Ce n'est pas comme si dans ChatGPT r�gnait la transparence et la libert� d'expression. Loin de l�. Certains devraient cesser de juger de leur propre vertu.

Et franchement, qui passe ses journ�es � formuler des prompts � propos de la politique de la Chine, que ce soit sur DeepSeek ou ChatGPT ? Est-ce que la censure chinoise a une quelconque influence sur votre quotidien ?

Tout cela ressemble � une campagne de d�nigrement qui ne dit pas son nom. C'est tout petit et tout moche. Tr�s occidental en soi.
2  0