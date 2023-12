Face à l'arrivée subite des intelligences artificielles génératives dans le sillage de ChatGPT, les médias ont d'abord fait une levée de bouclier. L'industrie s'est révoltée contre l'utilisation supposée des articles de presse pour entraîner les IA, sans rémunération. En parallèle, elle s'est montré extrêmement méfiante quant à l'usage des IA au sein des rédactions, jugée trop risquée à cause notamment des hallucinations, ces situations où l'IA présente un mensonge comme une vérité. Une double menace, en somme.

Mais les mois passants, l'IA s'impose de plus en plus dans les usages, et la posture des médias commencent à se détendre. Les rédactions s'interrogent sur les usages pertinents des nouveaux outils nourris à l'IA, tandis que de l'autre côté, OpenAI vient de signer son deuxième accord avec un groupe de presse pour exploiter légalement ses articles.

L'IA en soutien des journalistes

Signe des temps, mardi, le New York Times, souvent à la pointe de l'innovation du secteur de par son influence et ses moyens humains et financiers, a nommé un directeur des initiatives d'IA. Son rôle, entre autres, sera de piloter une petite équipe au sein de la rédaction de l'illustre journal, pour mener des expériences éditoriales autour de l'IA générative.

De son côté, le média spécialisé en tech et sciences Numerama a déployé la semaine dernière une fonctionnalité de résumé de ses articles par l'IA, intégré à sa nouvelle offre premium Numerama+. Ces résumés, point par point, font écho à une tendance assez répandue dans la presse tech américaine (Axios et Business Insider, notamment) mais aussi française (notamment chez 20 Minutes) depuis le milieu des années 2010.

« Même si c'est contre-intuitif, ces résumés sont un vecteur d'engagement. Après avoir lu l'information condensée, les lecteurs s'intéressent aux détails, et cela se reflète dans l'augmentation du temps de lecture passé sur l'article », résume Julien Cadot, directeur de la stratégie éditoriale de Numerama, étude à l'appui.

Problème : cette tâche s'avère non seulement rébarbative pour les journalistes, mais aussi chronophage. C'est là que l'IA entre en scène. « Pour créer du contenu, l'IA fait trop d'erreurs. En revanche, elle fonctionne extrêmement bien pour résumer du texte. On va donc lui donner cette tâche, très vite lassante pour les journalistes », développe-t-il.

Concrètement, le média a ajouté une nouvelle fonctionnalité dans son éditeur de texte. Une fois l'article fini, le journaliste clique sur un bouton, qui envoie une requête à GPT-4, le modèle le plus puissant de OpenAI. Ce bouton intègre un prompt (un texte donné en consigne au modèle d'IA) fait sur-mesure et régulièrement affiné, qui déclenche la génération du résumé. « Le prompt a demandé un vrai travail de réalisation, car il faut qu'il fonctionne aussi bien sur tous nos formats : tests, actualités, foires aux questions, enquêtes... », précise Julien Cadot.

Quelques secondes plus tard, la réponse de GPT-4 s'insère dans l'espace dédié, et l'auteur de l'article n'a plus qu'à relire le petit texte, et le corriger si besoin. « Généré par une IA, vérifié par Numerama », promeut le média. « Cette tâche prend 30 secondes, alors que le faire à la main peut prendre facilement cinq minutes », résume le dirigeant.

Les médias d'Axel Springer débarquent sur ChatGPT

Si les IA commencent à être intégrées dans la fabrique des articles, l'inverse est également vrai. Mercredi, le géant de de la presse allemande Axel Springer (Politico, Business Insider, Bild...) a signé en grandes pompes un partenariat inédit avec OpenAI, l'entreprise derrière ChatGPT. D'après le Financial Times, la coqueluche de l'IA va payer à l'éditeur une licence d'un montant « à huit chiffres », autrement dit, plus de dix millions d'euros par an, sur plusieurs années.

En échange, ChatGPT aura accès à tous les articles (payants) du groupe en quasi temps réel, et pourra répondre aux questions de ses utilisateurs par des résumés courts de ces articles. Autrement dit, les médias d'Axel Springer débarquent sur ChatGPT ! Ces réponses seront accompagnés de liens vers les articles complets sur le site du média d'origine, et le système sera déployé dès le début de l'année prochaine.

L'accord semble gagnant-gagnant. D'un côté, OpenAI adresse un des principaux défaut de son outil, jusqu'ici très mauvais pour donner des réponses véridiques sur des événements récents. De son côté, Axel Springer s'offre une exposition inédite auprès des plus de 100 millions d'utilisateurs par semaine de ChatGPT, et un nouveau canal d'audience voire d'abonnement... en plus d'être rémunéré pour ! L'accord octroie également à OpenAI le droit d'entraîner ses IA sur tous les articles des publications d'Axel Springer, archives comprises.

Avec l'accord, OpenAI s'évite aussi une potentielle guerre juridique. A l'heure actuelle, l'entreprise, tout comme ses principaux concurrents, ne divulgue aucun détail sur les jeux de données massifs sur lesquels sont entraînés ses IA. Mais bon nombre d'ayants droits, à commencer par les médias, ont conscience que leurs contenus sont pillés par des robots chargés d'amasser le plus de texte possible.

OpenAI commence à désamorcer la gronde des médias

En septembre, plusieurs grands noms de la presse française avaient d'ailleurs pris la décision de bloquer le « crawler » d'OpenAI, le robot charger d'aller chercher les textes sur leurs sites. Autrement dit, la question des droits d'auteurs est depuis plusieurs mois une véritable épée de Damoclès qui menace de s'abattre sur les créateurs des modèles d'IA. Ces derniers ont pour habitude de plaider le « fair use », c'est-à-dire l'usage raisonnable, lorsque la question est abordée, tout en ne précisant pas les contours.

Mais comme le relève Reuters, l'IA Act approuvé dans sa version non-définitive vendredi 8 décembre pourrait changer la donne. Il prévoit, en l'état, des obligations de transparence sur les données utilisées pour entraîner les modèles de fondation comme GPT-4, dont ChatGPT est décliné. Autrement dit, il pourrait révéler officiellement que le modèle d'IA est entraîné sur les articles de média.

Avec cet accord non-exclusif avec Axel Springer, un des groupes médias les plus influents d'Europe, OpenAI prend donc les devants pour éviter ce scénario catastrophe. En juillet, il avait déjà obtenu un accord avec l'Associated Press, afin d'entraîner ses IA sur les archives de l'agence de presse.

« C'est un excellent accord pour les deux partis. Mais il ouvre la brèche à des négociations en tête-à-tête, comme pour le cas des droits voisins », regrette de son côté Julien Cadot. Et de poursuivre : « Les médias, en tant qu'industrie, ont une véritable puissance à faire valoir grâce à leur rôle d'enrichissement des IA. Ils pourraient être les fournisseurs d'or pour les bijoutiers que sont les développeurs de modèles d'IA, et proposer une licence globale européenne. Mais ce genre d'accord de filière semble déjà inenvisageable ». Le risque ? Que les plus gros médias, capables de négocier à haut niveau et de mener des batailles juridiques complexes, signent leurs accords, et laissent sur le bas-côté les médias plus modestes, incapables de tenir le rapport de force. OpenAI minimiserait ainsi le risque juridique, sans passer à la caisse pour l'ensemble des ayants-droits.