Pendant un temps épargné par les poursuites judiciaires, ChatGPT accumule les ennuis depuis quelques mois. L’intelligence artificielle développée par OpenAI est accusée par un nouveau groupe d’écrivains de vol de propriété intellectuelle.
Ce n’est pas une révélation, ChatGPT, le chatbot conversationnel d’OpenAI, se nourrit de textes existants pour pouvoir étoffer ses connaissances et son modèle de langage. Dans l’immédiat, l’IA n’est pas directement reliée à Internet, même s’il existe des plugins qui permettent de faire des recherches avant d’obtenir une réponse à une requête.
Pour se former, ChatGPT pioche dans des bases de données existantes, et cela comprend notamment des ouvrages disponibles en ligne. Mais lesquels ? C’est impossible de le déterminer précisément. Cependant, depuis quelques mois, différents auteurs plus ou moins connus pensent qu’OpenAI a utilisé leurs écrits sans autorisation pour entraîner sa célèbre intelligence artificielle.
Un groupe d’auteurs attaque ChatGTP en justice
Lundi dernier, l’agence Reuters a rapporté qu’un groupe d’écrivains, parmi lequel on trouve Michael Chabon, gagnant d’un prix Pulitzer, Matthew Klam, Rachel Louise Snyder et Ayelet Waldman, a décidé de se liguer pour traîner OpenAI devant le tribunal de la cour fédérale de San Francisco pour « l’utilisation non autorisée et illégale » de leur contenu protégé par le droit d’auteur.
Les plaignants cherchent à obtenir le statut de recours collectif pour cette affaire, de sorte que d’autres auteurs puissent venir s’y ajouter. La plainte met en avant la capacité de ChatGPT à résumer et à analyser les textes des en auteurs en question. Selon ces derniers, cette démarche effectuée par l’IA serait impossible si elle n’avait pas déjà eu accès aux textes auparavant.
« Les actes de violation du droit d’auteur d’OpenAI ont été intentionnels, délibérés et au mépris total des droits des plaignants et des membres du groupe », expliquent les documents de justice. « OpenAI savait à tout moment pertinent que les ensembles de données qu’il utilisait pour entraîner ses modèles GPT contenaient des éléments protégés par le droit d’auteur et que ses actes violaient les conditions d’utilisation de ces éléments. »
Des procès qui s’accumulent pour OpenAI
Selon Reuters, il s’agit, au minimum, du troisième recours collectif qui vise les pratiques d’OpenAI en seulement quelques mois. Par ailleurs, certains des auteurs qui sont au cœur de cette nouvelle plainte font partie des signataires d’une lettre ouverte publiée en juillet dernier, demandant à OpenAI, mais aussi à Meta et à Google d’obtenir systématiquement « le consentement, le crédit et une compensation équitable pour les auteurs » dont les œuvres servent à « éduquer » les intelligences artificielles.
Parmi les autres affaires médiatisées récemment, on peut citer celle impliquant les auteurs Paul Tremblay et Mona Awad en juin, ciblant spécifiquement OpenAI, ainsi que celle concernant l’autrice et comédienne Sarah Silverman, qui a rejoint les écrivains Christopher Golden et Richard Kadrey dans un procès intenté en juillet dernier.
OpenAI est pour le moment resté muet face à ses nouvelles accusations. Cependant, dans le cadre d’affaires précédentes, l’entreprise américaine a fait valoir que la formation de l’IA fait partie, selon elle, d’un « usage équitable du matériel récupéré sur Internet et protégé par le droit d’auteur ». En résumé, tout le monde n’est pas d’accord sur la question, et on voit mal comment les autorités vont pouvoir éviter de légiférer concrètement sur ce genre de sujet.