OPINION. « IA “haut de gamme” : la souveraineté européenne se joue sur la qualité des données »
latribune.fr

Primavera de Filippi
DR
latribune.fr

Primavera de Filippi
DR
Par Primavera de Filippi, Directrice de la Recherche chez Alien Intelligence (*)
La dernière levée de fonds d'Anthropic (30 milliards de dollars pour une valorisation de 380 milliards) marque un tournant dans l'industrie de l'IA générative. Car au-delà des chiffres vertigineux, cette annonce révèle une mutation profonde du marché de l’IA : l'ère du web scraping touche à sa fin; avec l'IA d’entreprise, la qualité des données prime sur le volume.
Désormais 80% du chiffre d'affaires d’Anthropic provient du segment entreprise. Il s’agit d’un positionnement radicalement différent d'OpenAI, qui est encore largement orienté grand public. Cette stratégie B2B s'accompagne d'exigences nouvelles : traçabilité des sources, qualité vérifiable des données, et conformité réglementaire.
L'accord amiable d'Anthropic avec les auteurs américains est une illustration de ce nouveau paradigme. Les entreprises qui déploient Claude Code ne peuvent pas se permettre l'opacité juridique du web scraping; elles exigent des garanties sur la provenance et la légalité des données d'entraînement.
En Europe, l'AI Act impose des standards de transparence et de documentation des sources, créant ainsi un cadre réglementaire très avancé dans ce domaine. Cependant, les standards économiques se définissent ailleurs, et notamment aux États-Unis: Anthropic investit 50 milliards de dollars dans des datacenters américains; alors que OpenAI promet 1 400 milliards d’investissement.
Les entreprises et institutions européennes, qui traînent derrière les géants américains, doivent alors faire face à un dilemme. Soit elles laissent leurs données culturelles et scientifiques être ingérées massivement par les entreprises américaines qui entraînent les modèles d’IA les plus performants sur le marché — souvent sans aucune contrepartie économique — perdant ainsi tout contrôle sur l’utilisation qui est faite de ces données. Soit elles verrouillent complètement leurs données pour éviter un pillage incontrôlé, mais cela comporte alors le risque de devenir invisibles ou mal représentés au sein des modèles d’IA dominants, qui structurent désormais plus de la moitié des requêtes sur Internet.
L’actualité qui compte pour vous, chaque jour dans votre boîte mail.

L'IA générative repose sur le postulat qu’une plus grande quantité de données permet de créer des modèles de meilleure qualité. Or le succès d'Anthropic auprès des entreprises ne repose pas sur le volume des données, mais plutôt sur la fiabilité, la sécurité, et la qualité des outputs.
L’IA d’entreprise ouvre ainsi une opportunité pour l'Europe. Plutôt que d’essayer de rivaliser les entreprises américaines avec des volumes de données impossibles à égaler, nous pouvons faire de la qualité des données notre avantage concurrentiel. Imaginez une IA médicale qui consulte en temps réel les dernières publications de l’INSERM, avec des mécanismes de traçabilité pour la rémunération des ayants-droit; ou des modèles juridiques qui s'appuient sur les corpus du Conseil d'État, plutôt que sur des forums en ligne.
Cette vision pour la création d’une IA “haut de gamme" est à la portée des entreprises et des institutions européennes. Les architectures modernes comme le RAG (Retrieval Augmented Generation) permettent d'enrichir les modèles d’IA avec des connaissances spécialisées en temps réel, sans ingestion permanente. Au lieu de vendre nos données en bloc aux entreprises américaines pour entraîner leurs modèles, nous pourrions adopter un modèle de consultation à la demande : les IA accèdent aux bases européennes par le biais de requêtes spécialisées, où chaque requête génère des revenus pour les créateurs et agrégateurs de contenus.
Ce changement de paradigme ne peut se réaliser que par une infrastructure dédiée. Si Anthropic investi 50 milliards dans la création de ses propres datacenters, il ne s'agit pas seulement d’augmenter la puissance de calcul, mais aussi de construire une infrastructure souveraine qui lui permet de contrôler ses coûts, sa chaîne d'approvisionnement, et ses relations avec les fournisseurs de données.
L'Europe a besoin d’une infrastructure souveraine qui transforme notre patrimoine culturel et scientifique en flux de données exploitables par les IA de manière sécurisée, avec des mécanismes de traçabilité et de monétisation. Cette infrastructure, en respectant les règles de l'AI Act, peut faire de la conformité réglementaire un avantage plutôt qu'une contrainte commerciale. Car il s’agit d’une infrastructure qui établit les bonnes incitations économiques : quand les producteurs et détenteurs de contenus peuvent monétiser leurs données de manière récurrente et transparente, ils ont intérêt à maintenir la qualité et l’actualité de ces données.
Les chiffres d'Anthropic (revenus projetés de 14 milliards de dollars en 2026, contre 1 milliard l'an dernier) révèlent de la vitesse à laquelle le marché de l’IA générative se structure. D’ici quelques années, le marché sera entièrement consolidé, avec les entreprises rattachées à leurs fournisseurs d'IA préférés.
L'Europe ne peut pas se limiter à être le régulateur du monde numérique; elle doit devenir un acteur industriel crédible, capable de proposer une alternative au modèle américain. Et le succès de cette alternative ne peut pas reposer sur le protectionnisme européen, il doit se focaliser sur l’excellence. Cela implique la création d’une IA “haut de gamme” qui s'appuie sur l'expertise européenne et les données de qualité ; avec une infrastructure qui fait de la qualité et de la traçabilité des standards de marché, permettant de rémunérer les créateurs de contenus de façon équitable.
Car si l’Europe ne peut pas rivaliser sur le volume, elle doit s'imposer sur la qualité. L'IA haut de gamme n'est pas un luxe – c'est notre seule carte à jouer.
_____
(*) Primavera de Filippi, directrice de recherche au CNRS à Paris, associée à la faculté du Berkman-Klein Center for Internet & Society à Harvard, et directrice de la recherche chez Alien Intelligence.
latribune.fr