Dans la culture web, l'expression "to creep on someone" signifie traquer l'activité sur les réseaux sociaux d'une personne à son insu. L'équipe de chercheurs missionnée par l'Institut européen de l'innovation et de la technologie (EIT Digital) se l'est appropriée. Leur CREEP à eux est un projet de prévention aux effets du cyberharcèlement (Cyberbullying Effects Prevention). Dans plusieurs pays, des docteurs en informatique, en psychologie et en sociologie travaillent ainsi depuis 2018 sur des technologies de prévention et d'accompagnement du harcèlement sur les réseaux sociaux, à destination des adolescents.

L'équipe plurinationale (italienne, française, allemande) développe deux technologies. Au centre du projet, un outil d'apprentissage automatique scanne le contenu textuel disponible sur les réseaux sociaux et repère les cas de harcèlement. Ensuite, un "assistant virtuel", sous forme de chatbot, contacte la victime et l'aiguille vers des ressources utiles, en fonction de son profil. Leurs outils devraient être fonctionnels à la fin de l'année.

Transformer le cyberharcèlement en données

Elena Cabrio (Université Côte d'Azur) et Serena Villata (Université Côte d'Azur), deux chercheuses en intelligence artificielle de l'Université Sophia Antipolis, incarnent la branche française du projet. Elles travaillent sur la technologie de reconnaissance des cas de harcèlement. Deux ingénieurs en informatique de l'Inria les assistent dans le développement de l'outil.

"La définition du cyberharcèlement prend en compte le caractère répété du comportement, et le fait que plusieurs personnes aient la même cible", introduit Elena Cabrio.

Leur outil d'apprentissage automatique scanne les interactions sur un périmètre pré-défini. Les deux docteures projettent ensuite ces interactions sous forme de graphes. Les concentrations d'interactions se traduisent visuellement par des nœuds apparents entre sous-graphes. "Mais un nœud ne signifie pas forcément qu'il y a harcèlement, il peut s'agir d'une personnalité très sollicitée par exemple", relève la scientifique.

Vient alors la deuxième étape : leur outil analyse le contenu des messages échangés, à la recherche de propos spécifiques.

"C'est ici toute la difficulté, il faut traduire la sémantique (ndlr: le sens et la signification des mots) en données, et s'adapter au langage particulier des réseaux sociaux", expose Serena Villata.

Leur expertise entre alors en jeu: les outils qu'elles développent dans l'équipe du Wimmics sont réputés pour leur précision. Elles ont d'abord entraîné leur machine sur des données en open source issues de réseaux sociaux traditionnels, puis sur des données tirées d'une expérimentation et de jeux de rôle sur un intranet, dans un collège de Trente, en Italie.

Vers une application fonctionnelle fin 2019

"Nous devons être très précis, pour éviter le risque de surcharge des signalements de harcèlement", prévient Elena Cabrio. A l'inverse, elles ne peuvent aller trop loin dans la précision au risque d'écarter certains cas. C'est tout un équilibre que les chercheuses doivent donc trouver. Pour cela, elles peuvent compter sur leurs homologues italiens de la fondation Bruno Kessler. Le célèbre centre de recherche coordonne le projet, et plusieurs de ses docteurs en intelligence artificielle et en sociologie y participent. Deux entreprises, NeuroNation et Expert System, apportent également leur expertise de marché au projet. Un élément essentiel, puisque les outils CREEP doivent pouvoir se vendre d'ici la fin 2019.

"Notre objectif pour la fin de l'année est de proposer une appli finalisée, conforme au RGPD. Il faut aussi que nous testions l'application dans un environnement réel.", ambitionne Enrico Maria Piras, sociologue de la fondation Bruno Kessler, en charge du projet.

Le projet devait se terminer en 2018, mais a été reconduit pour une année supplémentaire. Objectif : ajouter de la reconnaissance d'image, grâce à l'apport d'une équipe Linkmedia de l'Inria de Rennes, et pousser les modules d'accompagnement plus loin. CREEP a déjà été testé dans des collèges de la ville italienne de Trente fin 2018, et l'expérience sera y reconduite ainsi qu'à Nice. Pour l'instant, CREEP s'adresse aux jeunes, et sera adapté à des intranets. Mais l'outil est pensé pour les usages des adolescents, sur Instagram ou Twitter. "Les 13-14 ans n'utilisent pas Facebook. Ils disent "Facebook c'est pour ma mère !" Ils utilisent tous Instagram, parfois TikTok." s'amuse Enrico Maria Piras.

« Il faudrait adapter notre logiciel pour qu'il soit compatible avec la politique de données de la plateforme », précise Elena Cabrio, lorsqu'on l'interroge sur l'éventualité de son application à un grand réseau social. Les chercheuses auraient d'ailleurs été approchées par Facebook, la maison mère d'Instagram, qui commence à s'intéresser à leur outil.

Le projet CREEP est financé par l'institut européen de l'innovation et de la technologie (EIT). Cette structure, dotée de 100 millions d'euros par l'UE et pensé comme un MIT Européen, promeut le transfert de technologie. 20 hommes et femmes, de milieu académique et professionnel, travaillent sur le projet.