Face au pillage des sites web par les géants de l'IA, la fronde s'organise

François Manens

Publié le 02 août 2024 à 15:41 - Mis à jour le 02 août 2024 à 15:41

Ce contenu est réservé aux abonnés La Tribune

Les sites tentent de se protéger contre les robots scrapper de OpenAI et Anthropic.

Ajouter La Tribune à vos sources préférées

De nombreux sites, à l'image du réseau social Reddit, ne veulent plus que les entreprises de l'intelligence artificielle pillent leurs données sans rien offrir en contrepartie. Alors ils tentent de bloquer les robots chargés d'aspirer leur contenu, une tâche plus difficile qu'il n'y paraît.

La gronde contre les géants de l'intelligence artificielle s'intensifie. En cause : OpenAI, Anthropic, Google et bien d'autres aspirent en continu les textes des millions de pages web, sans trop se soucier de l'avis de leurs propriétaires. La raison ? Les grands modèles d'IA qu'ils développent ont besoin de volumes de données toujours plus grands afin de produire des résultats toujours plus performants. Des articles de presse, aux recettes de cuisine, en passant par les sous-titres des vidéos YouTube, tout y passe : les ingénieurs font ingurgiter aux IA du contenu trouvé aux quatre coins d'Internet.

Mais les propriétaires de sites web sont de plus en plus nombreux à tenter d'arrêter ce pillage, d'autant plus que certains parviennent à tirer des millions d'euros dans le cadre d'accords officiels, à l'image de ceux du Monde avec OpenAI ou de Google avec le réseau social Reddit. Empêcher l'aspiration systématique des données passe par le blocage des robots scraper qu'utilisent les géants de l'IA. Ces petits programmes informatiques automatisés parcourent le web et téléchargent tout ce qu'ils trouvent. Mais les arrêter n'est pas si simple...

A LIRE AUSSI

Après la levée de boucliers, les médias commencent à ouvrir leurs portes à l'IA

Robot.txt, le panneau d'entrée des sites web

WhatsApp bouleverse son service : les numéros de téléphone des contacts remplacés par des pseudonymes

WhatsApp va remplacer progressivement les numéros de téléphone par des noms d’utilisateur, une évolution présentée comme un gain de confidentialité mais qui redéfinit en profondeur la manière d’entrer en contact sur la messagerie.

Tech & IA

Corée du Sud : un plan colossal dans l’IA en plein débat sur le partage des « superprofits » des géants des puces

Séoul a dévoilé ce lundi un plan de plus de 1 000 milliards d’euros sur dix ans dans l’IA. Cette annonce intervient alors que la Corée du Sud débat de la manière dont les profits colossaux générés par les semi-conducteurs devraient être redistribués plus largement dans la société.

Intelligence Artificielle

Richard Marko (Eset) : « Une puissance étrangère dont on dépend peut parfaitement couper toutes nos messageries »

Alors que l’intelligence artificielle redessine les contours de la cybersécurité, la question de la souveraineté numérique européenne n’a jamais semblé aussi urgente. Rencontré à Berlin, Richard Marko, directeur général d’Eset, leader européen dans les solutions de sécurité, nous livre sa vision.

Tech & IA

Le récent emprunt de SpaceX est mal passé auprès des investisseurs.

SpaceX : comment la coqueluche des marchés a perdu 900 milliards de dollars de valorisation en moins d'un mois

Introduite en Bourse il y a deux semaines, l'action SpaceX a déjà perdu près de 900 milliards de dollars de valeur depuis son pic. En cause, des dépenses colossales dans l'intelligence artificielle, des pertes qui s'accumulent et des investisseurs qui doutent désormais d'une valorisation jugée excessive.

Tech & IA

Le dévéloppement de GTA VI aurait coûté d'après les analystes entre 1 et 2 milliards de dollars.

GTA VI : un blockbuster sans disque qui enterre trente ans de culture de coffret iconique

Une boite pour le jeu vidéo le plus attendu de l'année, Grand Theft Auto VI, sera potentiellement en vente en novembre, mais elle sera vide de tout disque. En supprimant le circuit physique, Rockstar élimine une part du prix absorbé par les intermédiaires et oriente l'essentiel des revenus vers les plateformes numériques.

Tech & IA

ChatGPT proposera désormais trois versions différentes de son agent conversationnel pour des usages spécifiques.

OpenAI lance ses nouveaux modèles GPT-5.6, sous tutelle de la Maison Blanche

OpenAI a présenté sa nouvelle famille de modèles GPT-5.6, censé être plus puissante et moins chère que la précédente. Son déploiement est soumis à l'approbation du gouvernement américain, tout comme celui du concurent Anhtropic.

Tech & IA

IA : Washington autorise Anthropic à redéployer Mythos 5 auprès des entreprises américaines stratégiques

Peu après son blocage d'urgence, le modèle d'IA Mythos 5 d'Anthropic pourra de nouveau être utilisé par une poignée de groupes américains Le gouvernement l'avait interdit mi-juin, craignant qu'il ne puisse être détourné à des fins offensives par des acteurs malveillants.

Tech & IA

Mirendil ambitionne d’automatiser la recherche en IA

Remplacer l'ingénieur en IA, le pari vertigineux de Mirendil, nouvelle licorne californienne

Forte d’une levée de fonds de 200 millions de dollars et d'une équipe issue d'Anthropic, Mirendil développe des modèles capables d’automatiser la recherche en IA pour les équipes de recherche des entreprises. Un nouveau signe du succès des « néolabs », cette génération émergente d’entreprises d’IA qui s’attaquent à des problèmes que les éditeurs généralistes ne creusent pas.

Intelligence Artificielle

Face au pillage des sites web par les géants de l'IA, la fronde s'organise

Robot.txt, le panneau d'entrée des sites web

Sur le même sujet

WhatsApp bouleverse son service : les numéros de téléphone des contacts remplacés par des pseudonymes

Corée du Sud : un plan colossal dans l’IA en plein débat sur le partage des « superprofits » des géants des puces

Richard Marko (Eset) : « Une puissance étrangère dont on dépend peut parfaitement couper toutes nos messageries »

SpaceX : comment la coqueluche des marchés a perdu 900 milliards de dollars de valorisation en moins d'un mois

GTA VI : un blockbuster sans disque qui enterre trente ans de culture de coffret iconique

OpenAI lance ses nouveaux modèles GPT-5.6, sous tutelle de la Maison Blanche

IA : Washington autorise Anthropic à redéployer Mythos 5 auprès des entreprises américaines stratégiques

Remplacer l'ingénieur en IA, le pari vertigineux de Mirendil, nouvelle licorne californienne

Robot.txt, le panneau d'entrée des sites web

Sur le même sujet

WhatsApp bouleverse son service : les numéros de téléphone des contacts remplacés par des pseudonymes

Corée du Sud : un plan colossal dans l’IA en plein débat sur le partage des « superprofits » des géants des puces

Richard Marko (Eset) : « Une puissance étrangère dont on dépend peut parfaitement couper toutes nos messageries »

SpaceX : comment la coqueluche des marchés a perdu 900 milliards de dollars de valorisation en moins d'un mois

GTA VI : un blockbuster sans disque qui enterre trente ans de culture de coffret iconique

OpenAI lance ses nouveaux modèles GPT-5.6, sous tutelle de la Maison Blanche

IA : Washington autorise Anthropic à redéployer Mythos 5 auprès des entreprises américaines stratégiques

Remplacer l'ingénieur en IA, le pari vertigineux de Mirendil, nouvelle licorne californienne