Comment Neutral news veut analyser la propagation des fake news

 |   |  906  mots
L'outil Neutral news, créé par trois étudiants de l'EPITA, est capable de traduire en huit langues les contenus issus de 6.500 médias internationaux pour détecter les fake news.
L'outil Neutral news, créé par trois étudiants de l'EPITA, est capable de traduire en huit langues les contenus issus de 6.500 médias internationaux pour détecter les fake news. (Crédits : Kacper Pempel)
Baptisé Neutral news, cet outil dopé à l'intelligence artificielle agrège en continu les contenus de 6.500 médias internationaux. Capable de scanner "plusieurs centaines de milliers d'articles par jour" pour repérer les fake news, le projet a déjà convaincu le ministère des Affaires étrangères.

Elles se propagent à vitesse grand V. Les fake news, ces fausses nouvelles virales popularisées lors du Brexit en 2016 et amplifiées lors de l'élection présidentielle américaine, sont rapidement devenues un fléau pour les réseaux sociaux et l'information. La plupart des processus électoraux ou mouvements sociaux sont désormais accompagnés de leur lot de fake news sur Internet. Pour percer le mystère de leur propagation, trois étudiants de l'EPITA (École pour l'informatique et les techniques avancées, basée aux portes de Paris) ont créé Neutral News. Dopé à l'intelligence artificielle et au machine learning, cet outil d'analyse des contenus sur Internet permet de détecter les fake news pour les signaler aux lecteurs.

« Initialement, nous voulions agréger le plus de contenus possibles sur une seule et même plateforme pour contextualiser l'information tout en proposant différents points de vue, qu'ils soient politiques ou géographiques », explique Jonas Bouaziz, 21 ans, en charge de l'analyse des données pour Neutral News.

Repéré lors d'un concours organisé par Microsoft en mars dernier, les trois étudiants sont ensuite entrés en contact avec le ministère des Affaires étrangères, qui est devenu leur premier partenaire. « Nous avons alors recentré notre outil sur la détection de fake news pour répondre aux besoins spécifiques du ministère, qui souhaite par exemple connaître les processus de propagation de ces contenus », poursuit Jonas Bouaziz. Toujours en cours de développement, une version bêta de Neutral News a été livrée fin novembre au ministère des Affaires étrangères.

Des "centaines de milliers d'articles analysés par jour"

Les contenus de 6.500 médias, issus de 191 pays, sont agrégés en continu pour réaliser une veille de l'actualité. « Actuellement, Neutral News est capable d'analyser plusieurs centaines de milliers d'articles par jour »  issus de la presse gratuite en ligne, chiffre Jérémie Zimmer, 21 ans, en charge de l'intelligence artificielle pour Neutral News. Les textes des articles sont ensuite analysés via une multitude de critères : sémantique, syntaxique, URL des pages... Neutral News est également capable d'analyser le pourcentage de plagiat d'un article. L'outil a été développé à partir de logiciels open source - mis à disposition de tous librement sur des plateformes dédiées, et donc le code informatique peut être modifié.

Le but : proposer un indice de fiabilité au lecteur. L'article est-il similaire à d'anciennes fake news en terme de vocabulaire ou de ponctuation ? Provient-il d'une source identifiée comme fiable ? Autant de questions à répondre pour juger de la véracité de l'information. « Si l'outil considère que l'information est potentiellement manipulée, alors l'article sera affiché sur la plateforme avec un signe "attention" à côté du titre. Nous voulons un outil transparent, donc les critères qui laissent à penser que c'est une fake news seront également détaillés », affirme Arnaud Henric, 22 ans, chargé de l'interface utilisateur pour Neutral News.

Traduction en huit langues

L'utilisateur pourra choisir les filtres de son choix : langues, sources, sujets (politique, économie...), fiabilité, géographie (national ou international)... « Il n'y a pas de censure de l'information, ni de fil personnalisé. Tous les articles agrégés sont traités exactement de la même façon, souligne Jonas Bouaziz. L'idée est d'ouvrir le contenu au maximum pour ne pas enfermer les lecteurs dans des bulles. » Un reproche régulièrement fait au fil d'actualité de Facebook, dont l'algorithme met en avant les informations partagées par ses contacts identifiés comme semblables. L'utilisateur se retrouve ainsi « enfermé » dans un cercle sans débat idéologique. Sur Neutral News, la Une de la plateforme affichera les 20 derniers articles agrégés selon les filtres sélectionnés par l'utilisateur.

Pour relier les articles les uns aux autres, et retracer la propagation d'un contenu, Neutral News recourt à la technique d'analyse lexicale, dite "lemmatisation". Elle permet de donner une forme neutre à un mot. Par exemple, un verbe conjugué sera passé à l'infinitif. « Nous nous sommes amusés à construire notre propre dictionnaire pour pouvoir traduire les articles en huit langues (anglais, espagnol, italien, russe, français, néerlandais, portugais et allemand). Nous ne voulions pas dépendre d'outils tiers, comme Google traduction », affirme Jonas Bouaziz. Il est ensuite possible de tracer une timeline (en fonction de l'heure de publication) et une carte (en fonction des coordonnées géographiques attribuées à l'article).

Trouver un business model

À terme, les trois étudiants aimeraient développer leur outil à partir des retours d'expérience des journalistes sur la pertinence des informations.

« Notre outil repose sur du machine learning. Plus nous aurons de retours sur la fiabilité des informations, plus nous pourrons améliorer notre algorithme pour nous caler sur les nouvelles tendances de fake news », détaille Jérémie Zimmer.

Si l'outil peut intéresser les organisations publiques et les médias, un développement dédié aux entreprises privés est également envisageable. « Techniquement, il serait possible de faire des analyses de réputation pour des personnes ou des marques données. Notre intelligence artificielle se livre à deux niveaux d'analyse : le texte stricto sensu, puis le sentiment dégagé par le contenu. Par exemple, notre outil va scanne les adjectifs utilisés pour savoir s'ils sont mélioratifs ou péjoratifs », explique Jérémie Zimmer. Les étudiants planchent actuellement sur la détermination d'un business model viable pour pouvoir développer leur outil.

Réagir

Votre email ne sera pas affiché publiquement
Tous les champs sont obligatoires

Commentaires
a écrit le 23/12/2018 à 11:50 :
Ce projet n’est pas mal du tout .
Par contre le résultat ( efficacité)ne sera pas du 100%.

- à cause des paramètres antécédents
- ça ne pourra pas tracer les schémas neurologiques des intentions et des pensées.

- peut être qu’il faut mettre en parallèle un autre outil avec celui qui est présenté actuellement?
a écrit le 19/12/2018 à 19:28 :
Ce système aurait dû détecter les articles bidons publiés dans le Spiegel et d'autres media allemands par Relotius...Pour les journalistes c'est une bien mauvaise nouvelle qui va inciter les gogos de tous poils à critiquer la presse .
a écrit le 19/12/2018 à 18:35 :
Pas de souci... France 3 se charge de rétablir la vérité vraie . Sic! Vous avez avez encore confiance dans les médias ? ... Moi non . À la rigueur le canard enchaîné.
Réponse de le 20/12/2018 à 8:21 :
Bah alors pourquoi lire cet article? Allez vous informer sur FB puisque c'est mieux.
a écrit le 19/12/2018 à 17:20 :
En démocratie, on a le droit de mentir autant qu'on veut. Donc, en dehors d'un éventuel état de guerre, il n' y a a aucun problème de fausse nouvelle dans une démocratie. Il n'y a que dans les états totalitaires qu'il y en a.
a écrit le 19/12/2018 à 13:47 :
Il manque un "gendarme" type CSA pour la presse. En attendant un site qui répertorie les fakenews et un classement du nombre de fake news par titre de presse.
a écrit le 19/12/2018 à 12:56 :
On a raison d'être méfiants vis-à-vis des risques de limitation des libertés, malgré tout, la mise en place de garde-fous et d'outils de défense contre des manipulations d'où qu'elles viennent (intérieur/extérieur) me semble nécessaire. Qui est aujourd'hui contre les règles professionnelles qui régissent le métier de journaliste ?
Pourquoi des règles ne s'appliquerait-elles pas aux entités qui se donnent un rôle équivalent au sein de notre société ?

Certes chacun doit rester libre de lire ce qu'il veut, mais avec un minimum d'information sur l'origine de l'article et de son auteur (voire de sa fiabilité si cela peut être évalué objectivement).
Pourquoi colle-t-on des dizaines d'informations sur les produits alimentaires (origine, composition, etc.) ? J'ai toujours le droit de bouffer des m... industrielles mais au moins je suis au courant, c'est mon choix !

@Citoyen blasé: "Cette volonté de l'union européenne financière ": on ne comprend pas votre remarque, est-elle liée à cet article ?
a écrit le 19/12/2018 à 9:16 :
Cette volonté de l'union européenne financière de vouloir nous empêcher de lire ce que l'on veut n'est que la démonstration de la puissante dictature qu'elle a généré afin de créer un empire prévu pour durer mille ans.

"Il n'y a pas d'alternative démocratique aux traités européens" Juncker

On le voit bien...

Merci pour votre commentaire. Il sera visible prochainement sous réserve de validation.

 a le à :