L’intelligence artificielle ChatGPT est attaquée en justice par deux romanciers américains, qui accusent aujourd’hui l’algorithme d’OpenAI d’avoir utilisé leurs offres pour la « former » à la rédaction de textes. Des poursuites qui pourraient se transformer en action collective.
Ce n’est pas une nouveauté, ChatGTP est une intelligence artificielle conversationnelle qui se nourrit de ses échanges avec ses utilisateurs pour se perfectionner. Mais selon l’auteur de science-fiction et d’horreur Paul Tremblay et la romancière Mona Awad, OpenAI irait encore plus loin, en utilisant des œuvres littéraires éditées dans le but d’éduquer l’intelligence artificielle.
C’est en tout cas l’accusation qui est mise en avant dans la plainte que les deux écrivains américains ont déposée, mercredi dernier, devant le tribunal fédéral de San Francisco, rapporte Reuters.
Des milliers de livres copiés sans autorisation
Selon les deux auteurs à l’origine de la plainte, OpenAI aurait extrait des données de milliers de livres pour nourrir ChatGTP, le tout sans aucune autorisation. Si cette accusation était avérée, cela représenterait une grave violation des droits d’auteurs pour les écrivains concernés. Selon les plaignants, l’entreprise américaine se serait basée sur des bases de données comme Library Genesis et Sci-Hub, qui utilisent des téléchargements de torrents pour récupérer illégalement des œuvres protégées par le droit d’auteur, comme l’explique Bloomberg.
« Ces bibliothèques fantômes manifestement illégales intéressent depuis longtemps la communauté de formation à l’IA », explique la plainte. OpenAI aurait commencé à éduquer ChatGPT avec des bases de données illégales en 2020, lors de son travail sur GPT-3. 300 000 ouvrages pourraient, ainsi, être concernés.
Tout le sujet va être de prouver que les auteurs à l’origine de la plainte sont dans le vrai concernant les pratiques d’OpenAI. Ils espèrent également, en médiatisant leur combat, motiver d’autres écrivains à les rejoindre, dans le but de mettre en place une action collective (class action) qui aurait plus de poids au tribunal.
Les procès contre les IA s’accumulent
Ce n’est pas la première fois qu’OpenAI est attaqué en justice. Il y a seulement quelques semaines, l’entreprise de Sam Altman a déjà fait l’objet d’une plainte concernant de fausses informations diffusées par ChatGPT. L’intelligence artificielle accusait un animateur radio américain d’avoir détourné les fonds d’une association à but non lucratif. De quoi mettre en avant le caractère parfois mensonger des informations diffusées par le chatbot.
D’autres services d’intelligence artificielle sont également poursuivis. Getty Images a notamment attaqué le générateur d’art Stable Diffusion pour avoir prétendument volé plus de 12 millions d’images au sein de sa base de données. De leur côté, des artistes ont décidé de s’attaquer à Midjourney et à DeviantArt, pour vol d’œuvres et diffusion de plagiat sans consentement ni compensation. Selon les plaignants, des millions d’artistes seraient concernés, mais l’immense majorité ne le sait pas.
Toutes ces attaques démontrent, s’il le fallait encore, que toutes ces intelligences artificielles n’inventent rien : elles « puisent leur inspiration » dans des ressources existantes, et cela sans l’autorisation des propriétaires légitimes. La question de la légalité autour de ces pratiques mérite clairement d’être tranchée.