"L'IA générative des défendeurs repose sur des modèles d'apprentissage massif qui ont été construits en copiant et utilisant des millions d'articles du Times protégés par les droits d'auteur", explique le vénérable quotidien américain pour justifier sa plainte.
Selon une porte-parole, il s'agit bien d'une "violation des droits d'auteur en terme de contenu et de travail journalistique". Selon la plainte, le journal estime à "plusieurs milliards de dollars" le préjudice subi, dans les faits et d'un point de vue légal.
Valeur particulière reconnue
D'autant que Microsoft et OpenAI "ont donné aux contenus du Times une importance particulière dans la construction de leur modèle d'apprentissage, soulignant une préférence qui reconnaît la valeur de ce travail".
Le quotidien explique également avoir tenté en vain de négocier avec les deux entreprises afin de "recevoir une compensation adéquate pour l'utilisation de ses contenus".
"Les lois sur les droits d'auteur protègent notre journalisme. Si Microsoft et OpenAI veulent utiliser notre travail pour un usage commercial, la loi les oblige à demander d'abord la permission. Ils ne l'ont pas fait", a insisté la porte-parole. Pour l'heure, ni Microsoft ni OpenAI n'ont fait de commentaire.
Accord récent en Allemagne
Mi-décembre, OpenAI avait trouvé un accord avec le groupe allemand Axel Springer, éditeur notamment du tabloïd Bild, pour le rémunérer afin de fournir des contenus du groupe dans les réponses aux requêtes d'utilisateurs de ChatGPT.
Selon les termes de ce partenariat présenté comme inédit par les deux acteurs, les utilisateurs posant une question à ChatGPT recevront en réponse des résumés d'articles édités par les marques d'Axel Springer, notamment Politico, Business Insider, et les quotidiens Bild et Welt.
>> Lire sur le même sujet : Le géant de la presse Axel Springer biffe des postes rendus "superflus" par l'intelligence artificielle
Depuis le lancement de ChatGPT il y a un an, les géants de la Silicon Valley se livrent une course effrénée à l'IA dite générative. Celle-ci permet d'obtenir textes, images ou lignes de code d'un niveau équivalent à ceux produits par des humains, sur simple requête en langage courant, des modèles entraînés principalement grâce à la masse des contenus présents en ligne.
>> Lire également : La population suisse critique à l'égard de l'IA dans le journalisme, montre une étude
ats/jop