Pour régler la guerre entre les entreprises de l'IA et les ayants droit, le lobby des start-up propose une rémunération au forfait des créateurs de contenus. En échange, les concepteurs des IA pourraient puiser librement dans les données accessibles en ligne, sans possibilité pour les créateurs de s'y soustraire.Rémunérer les artistes et créateurs de contenus contre l'utilisation sans restriction de leurs productions par les IA génératives. C'est, en substance, ce que propose France Digitale dans un rapport publié le 10 décembre, sur l'intelligence artificielle et les ayants droit.
Ce sujet brûlant, qui agite le monde culturel et celui de l'IA depuis plusieurs mois, cristallise deux visions opposées.
D'un côté, les ayants droit, qui dénoncent l'usage abusif de leurs œuvres par les modèles d'IA, d'autant plus que celles-ci sont parfois utilisées pour remplacer leur travail. De l'autre, les concepteurs de ces modèles, pour qui l'accès aux données est essentiel. Pour créer des images et des textes inédits, les modèles d'IA générative comme GPT-4o (le moteur de ChatGPT), Midjourney ou encore Mistral, ont en effet besoin d'énormément de données, qui comprennent notamment des créations de tout genre (littéraires, visuelles, musicales...).
Revenir sur le « droit de fouilles »
L'objectif affiché de France Digitale est de trouver un compromis qui permettrait, avance le lobby, de satisfaire les deux camps. Pour cela, l'organisation souhaite revenir sur une directive européenne datant de 2019, et spécifiquement sur une exception du droit d'auteur prévue pour les IA, appelée « text and data mining » ou droit de fouilles.
Grâce à cette exception, les entreprises développant des modèles d'IA peuvent utiliser les contenus accessibles librement en ligne (cela ne s'applique pas aux contenus derrière un « paywall »), sans avoir à notifier les ayants droit. Ce « scraping » massif (collecte de données) a toutefois une limite : les créateurs disposent d'un droit de retrait dit « opt-out », leur permettant de soustraire leurs œuvres des données d'entraînement des IA.