Meta se retrouve une fois de plus sous le feu des critiques pour son utilisation des données personnelles des utilisateurs. Désormais, les données ne sont plus collectées uniquement pour le ciblage publicitaire, mais aussi pour alimenter ses intelligences artificielles génératives. Pour entraîner ses modèles créateurs d'images et de texte, la firme compte dès le 26 juin utiliser les photos et autres contenus postés par ses utilisateurs. Les messages privés envoyés entre particuliers ne sont pas concernés. Un récent changement de politique de confidentialité a alerté les utilisateurs et une association de défense des droits numériques. Noyb (pour "None of your business", signifiant en anglais "Ce ne sont pas vos affaires"), créée par l'activiste autrichien Max Schrems, vient tout juste de déposer des plaintes dans 11 pays européens dont la France, l'Allemagne et l'Espagne. L'organisation demande aux autorités d'intervenir en urgence pour empêcher la nouvelle politique du géant.

We (@NOYBeu) filed 11 complaints today against @MetaAI's attempt to just use all public and private data (other than chats) of roughly 400 million European users for unspecified current and future "AI technology". We asked for an urgency perocedure.https://t.co/U52U7CyNh3 — Max Schrems 🇪🇺 (@maxschrems) June 6, 2024

Noyb reproche à l'entreprise de Mark Zuckerberg d'utiliser ces données sans demander le consentement des utilisateurs, pourtant obligatoire dans le cadre du Règlement général de la protection des données (RGPD). Par défaut, l'utilisateur participe à cette collecte.

Refuser la collecte de ses données sur Instagram : une corvée

« Meta dit en substance qu'elle peut utiliser "n'importe quelle donnée provenant de n'importe quelle source pour n'importe quel objectif et la mettre à la disposition de n'importe qui dans le monde", à condition que cela se fasse par le biais de la "technologie de l'IA". (...) L'expression "technologie d'IA" est extrêmement large (...) il n'y a pas de limite légale réelle, s'emporte Max Schrems dans le communiqué de Noyb. Meta ne dit pas à quoi serviront les données, il pourrait donc s'agir d'un simple chatbot, d'une publicité personnalisée extrêmement agressive ou même d'un drone tueur. Meta précise également que les données des utilisateurs peuvent être mises à la disposition de n'importe quel "tiers", c'est-à-dire n'importe qui dans le monde. »

Interrogé sur la finalité précise de cette collecte, Meta ne souhaite pas donner plus d'informations.

Pour rappel, Noyb est expérimentée sur les questions juridiques relatives au RGPD. Elle est à l'origine de nombreuses plaintes contre les géants du web. Dans le cas de Meta, ses actions ont conduit à « des amendes administratives de plus de 1,5 milliard d'euros », rappelle-t-elle. Interrogé, Meta conteste ces plaintes. « Nous sommes convaincus que notre approche est conforme aux lois sur la protection de la vie privée et qu'elle est cohérente avec la manière dont d'autres entreprises technologiques développent et améliorent leurs expériences en matière d'IA en Europe, affirme un porte-parole. Pour ce qui est du contexte, nous avons longuement consulté la Data Protection Commission irlandaise - notre principal organisme de réglementation en matière de protection de la vie privée en Europe - à l'avance. Google et OpenAI utilisent également la même base juridique que nous et disposent d'un formulaire d'objection. Pourquoi ces sociétés ont le droit de le faire, et pas Meta ? » Pour information, Noyb a également déposé une plainte contre OpenAI.

Mais ce formulaire d'objection n'est pas facilement accessible. En arrivant sur Instagram ou Facebook, aucune fenêtre ne permet de refuser simplement cette collecte. Le formulaire est accessible dans la section « a propos », tout en bas du menu « paramètres » accessible seulement depuis son profil. Il faut ensuite cliquer sur « politique de confidentialité », puis « droit d'opposition ». Soit 5 clics. Une fois sur le formulaire, il faut écrire une justification, entrer son adresse mail pour recevoir un code qui permet de valider l'envoi. Interrogé, le porte-parole de Meta rétorque qu'il ne s'agit que de « 2 clics » via la « notification » en page d'accueil de l'application. Mais la notification n'était pas visible au moment où nous avons testé l'envoi de ce formulaire. En revanche, la demande que nous avons effectuée a été acceptée en quelques minutes seulement.

Une fois absorbées par les modèles d'IA, les données ne peuvent pas être supprimées

Noyb s'insurge également contre l'impossibilité pour les utilisateurs de supprimer leurs données une fois qu'elles sont entrées dans le système. Le porte-parole confirme qu'effectivement « le droit d'opposition n'est pas rétroactif. Par conséquent, si vous vous opposez maintenant, aucune de vos données ne sera utilisée lorsque l'entraînement des modèles commenceront à la fin du mois. Mais si vous vous y opposez dans deux mois, il se peut que certaines de vos données accessibles au public aient déjà été utilisées, et compte tenu du mode de fonctionnement et d'apprentissage des modèles, nous ne pouvons pas leur apprendre à "désapprendre" vos informations.. » Ce qui est contraire au « droit à l'oubli », pointe l'association.

En parallèle de ces dépôts de plainte, plusieurs utilisateurs ont protesté contre l'utilisation de leurs contenus. Sur Instagram notamment, ils sont quelques centaines de milliers à partager le même texte.

« Je détiens tous les droits des images et des publications de ce profil Instagram. Donc je ne consens pas à ce que Meta et d'autres entreprises les utilisent pour entraîner des intelligences artificielles génératives. Cela inclut toutes publications/stories futures et passées.»

Ce message a été diffusé via un sticker "ajout perso". Cette fonctionnalité, qui a notamment permis à l'image "All eyes on Rafah" de devenir virale, permet de dupliquer le même contenu en un clic.

Le grand public de plus en plus inquiet de la collecte des données pour alimenter les IA

Le mouvement n'est pas massif à l'échelle des 2,3 milliards d'utilisateurs actifs de la plateforme. Mais il est symptomatique d'une prise de conscience croissante chez les utilisateurs que leurs photos, commentaires, vidéos... servent aux géants du numériques à améliorer les performances des intelligences artificielles génératives.

Ces systèmes comme ChatGPT, Llama (le modèle de Meta), ou les générateurs d'images DALL-E et Midjourney qui peuvent produire à partir d'un court prompt (une instruction) un contenu inédit, ont besoin d'énormément de données pour améliorer leurs performances. Les premières versions de ces modèles ont généralement été entraînées sur des données dites publiques. Cela peut comprendre des pages en accès libre sur les réseaux sociaux, des commentaires, des images postées sur Flickr et d'autres bases de données photos, des ouvrages en accès libre, des vidéos YouTube...

Alimenter les IA avec ses données : une pratique déjà dénoncée par les artistes et écrivains

Ce fonctionnement a déjà été dénoncé à maintes reprises par le passé. Notamment par les artistes et les auteurs, qui s'insurgent contre une reprise de leur travail sans leur consentement, et sans toucher de droits. Ces derniers mois, des attaques en justice et autres lettres ouvertes se sont multipliées en ce sens. Mais en s'attaquant aux données privées des utilisateurs, Meta élargit cette problématique à l'ensemble des Internautes.

Les utilisateurs de Facebook et Instagram ne sont pas les seuls à se rebiffer contre cette collecte de données d'un genre nouveau. Sur Reddit, ils sont aussi nombreux à s'en inquiéter. Le réseau social a décidé depuis quelques mois de vendre les publications de ses utilisateurs à OpenAI et Google, toujours dans le but d'entraîner les grands modèles de langage. Ces entreprises piochaient déjà dans les forum Reddit, mais désormais Reddit a verrouillé leurs accès et ne le déverrouille qu'en échange de rémunération. Son contrat avec Google serait de l'ordre de 60 millions de dollars annuel. Les Redditors, les producteurs de ces données, ne toucheront rien. Cette décision a entraîné des mouvements de protestation sur la plateforme, notamment au sein de la communauté r/AIWars qui compte 20.000 membres.

En mai, Slack (propriété de Salesforce) s'est également attiré les foudres des utilisateurs, explique Ars Technica. Ces derniers, alertés par un ingénieur sur Threads, ont appris que la politique de confidentialité de la plateforme autorise l'utilisation de leurs messages pour alimenter les IA de l'entreprise. Face à la polémique, Slack a précisé que les messages pouvaient servir à améliorer des algorithmes de recommandation ou système de recherche, mais pas à alimenter de grands modèles de langage, ce que soupçonnaient certains observateurs. La controverse illustre une fois de plus que ce sujet est devenu une nouvelle source de tension entre usagers et plateformes.

Les plaintes de Noyb seront suivies de nouvelles procédures dans les autres pays de l'UE "dans les prochains jours".