OpenAI va devoir rendre des comptes à la justice. Trois auteurs ont assigné lundi en justice OpenAI, créateur de l'interface d'intelligence artificielle générative ChatGPT. L'humoriste Sarah Silverman, auteure de l'autobiographie « The Bedwetter », ainsi que Christopher Golden et Richard Kadrey, deux écrivains connus aux Etats-Unis notamment pour leurs ouvrages de fantasy accusent l'entreprise d'avoir utiliser le contenu de leurs livres afin d'alimenter ChatGPT, qui peut répondre à des demandes en langage courant et générer du texte.

Les trois auteurs n'ont pas de preuve directe de ce qu'ils avancent. Il n'est pas certain qu'OpenAI ait utilisé leurs ouvrages afin d'alimenter le modèle de langage du robot conversationnel ChatGPT. Toutefois, après avoir demandé au logiciel un résumé des livres, les auteurs déclarent avoir obtenu un contenu « très juste » et conforme au récit de chaque livre, même si « certains détails sont faux ».

Or, ChatGPT n'est pas alimenté en temps réel par des sources internet. Le robot conversationnel s'appuie sur une quantité limitée d'informations (contrairement à l'interface de Google Bard). Cela voudrait donc dire que les éléments relatifs aux livres présents dans les résumés ont été entrés dans le logiciel.

Concernant la procédure juridique, les trois écrivains ont demandé à un juge fédéral de San Francisco de la qualifier en action de groupe, ce qui permettrait à d'autres de s'y joindre.

Meta visée par les mêmes accusations

Ces auteurs ont également intenté une action contre Meta. Ils reprochent à la société mère de Facebook et Instagram d'avoir fait de même pour son propre logiciel d'IA générative, LLaMA. Les trois écrivains soulignent que le groupe de Menlo Park a reconnu avoir utilisé des librairies en ligne, notamment Bibliotik, qui propose des livres numérisés sans l'autorisation de leurs auteurs ou de leurs éditeurs. Mais ils ne déclarent pas avoir demandé au logiciel de résumer leurs livres.

LLaMA n'est pas encore disponible pour le grand public. Meta n'a donné accès à son logiciel qu'à nombre limité d'utilisateurs.

Protéger la propriété intellectuelle

Ce n'est pas la première fois qu'un logiciel d'intelligence artificielle générative se trouve au cœur d'une procédure juridique. Deux écrivains, la Canadienne Mona Awad et l'Américain Paul Tremblay (« La cabane aux confins du monde ») avaient déjà assigné en justice OpenAI fin juin. Et plus tôt cette année, au mois de janvier, des artistes ont attaqué Midjourney, Stable Diffusion et DreamUp sous forme d'action de groupe. Ces trois plateformes sont formées grâce à des milliards d'images récoltés sur Internet. Certains artistes et photographes de presse veulent pouvoir accepter ou refuser que leurs œuvres soient utilisées pour l'entraînement d'un modèle.

Ces actions en justice s'inscrivent dans la lignée d'autres procédures qui visent à policer les pratiques des développeurs de logiciels d'IA générative, qui sont nourris d'immenses quantités de données, dont certaines sont protégées par le droit de la propriété intellectuelle.

L'IA et la protection des données Ces logiciels d'IA générative soulèvent aussi des craintes quant à la protection des données personnelles des utilisateurs. Vendredi 31 mars, l'Italie est devenue le premier pays à bloquer provisoirement ChatGPT, en raison notamment de craintes sur la sécurité des données personnelles, l'absence d'une note d'information aux utilisateurs, et l'absence de filtre pour vérifier l'âge des utilisateurs. D'autres autorités européennes, dont celles de la France, de l'Irlande ou de l'Allemagne se sont depuis rapprochées de leur homologue italienne pour établir une position commune sur ChatGPT. Mardi 4 avril, c'est au tour du Commissariat à la protection de la vie privée du Canada d'annoncer qu'il ouvrait une enquête sur l'entreprise américaine. Elle « a été lancée à la suite d'une plainte selon laquelle des renseignements personnels ont été recueillis, utilisés et communiqués sans consentement », a indiqué l'organe gouvernemental. Le commissaire à la protection de la vie privée Philippe Dufresne a aussi ajouté dans le communiqué que « nous devons suivre la rapide évolution des avancées technologiques, et même conserver une longueur d'avance sur ce plan ». Joe Biden a de son côté évoqué, mardi 4 avril, les risques potentiels de l'intelligence artificielle, lors d'une réunion avec des conseillers. Le président démocrate a de nouveau demandé au Congrès de mettre en place des « limites strictes » sur les données personnelles collectées par les groupes de la tech, et d'interdire la publicité ciblée visant les enfants.

