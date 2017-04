LA TRIBUNE - Vous aviez perçu la montée de François Fillon et la possibilité qu'il gagne la primaire bien avant les sondages. Idem pour la victoire de Benoît Hamon aux primaires. Quels enseignements tirez-vous des réseaux sociaux Facebook et Twitter ?

LEENDERT DE VOOGD - Depuis le 1er février, 35 millions de tweets concernant la campagne électorale ont été publiés et diffusés sur Twitter. Les réseaux sociaux sont une formidable expression de l'opinion publique, que nos outils algorithmiques permettent d'analyser finement et que les sondages ne prennent pas en compte. Or, l'expérience nous montre que les dynamiques présentes sur les réseaux sociaux sont en avance sur les sondages et se retrouvent souvent dans le vote, comme cela a été le cas pour la victoire de François Fillon aux primaires. Nous avions perçu plus d'un mois à l'avance alors que les derniers sondages le donnaient au mieux deuxième derrière Alain Juppé.

Les derniers sondages publiés le 19 avril indiquent tous la même hiérarchie : Emmanuel Macron en première position suivi de très près par Marine Le Pen, puis François Fillon et Jean-Luc Mélenchon un peu plus loin, mais dans la marge d'erreur avec un écart entre le premier et le dernier inférieur à 7 points. Retrouvez-vous cette hiérarchie sur les réseaux sociaux à quelques jours du premier tour ?

Non. Pas dans cet ordre. Aujourd'hui, et depuis une bonne semaine, la dynamique sur les réseaux sociaux révèle plutôt un trio de tête composé de François Fillon, d'Emmanuel Macron et de Jean-Luc Mélenchon. Marine Le Pen, bonne quatrième, est très largement distancée, signe que sa campagne ne prend pas. Du mercredi 12 au mercredi 19 avril, 1,26 million de tweets ont concerné Emmanuel Macron, 1,25 million ont concerné François Fillon et 1,22 million ont concerné Jean-Luc Mélenchon, contre seulement 589.600 pour Marine Le Pen, qui suscite presque deux fois moins d'intérêt malgré le soutien de la très active « fachosphère », un relais très puissant sur internet. Les trois premiers sont donc dans un mouchoir de poche. Si on regarde le nombre de personnes qui tweetent à leur sujet, on remarque un avantage à Jean-Luc Mélenchon et à François Fillon. 172.600 personnes ont tweeté sur Jean-Luc Mélenchon, contre 167.100 sur François Fillon, 137.400 sur Emmanuel Macron et 122.700 sur Marine Le Pen.

Au-delà de ces chiffres, qui révèlent une certaine dynamique, c'est le contenu des messages qui importe. Nos algorithmes indiquent que c'est François Fillon qui déclenche le plus de contenus positifs, donc d'engagement, de la part des internautes. C'est surprenant, mais cela a été le cas, malgré les affaires, depuis le début de la campagne. À l'inverse, Marine Le Pen ne semble pas avoir su profiter de son avance, qui s'érode sur les réseaux sociaux plus vite que dans les sondages. De leur côté, Emmanuel Macron et Jean-Luc Mélenchon connaissent une dynamique réelle et solide. Le meeting de Bercy du 17 avril a encore renforcé Emmanuel Macron, tandis que Jean-Luc Mélenchon surfe sur une vague forte depuis le débat du 4 avril sur BFM TV et CNews.

La dynamique sur les réseaux sociaux -car nous analysons Facebook aussi- indique donc que François Fillon est sous-estimé dans les sondages et qu'il a de grandes chances de se qualifier pour le second tour. À l'inverse, Marine Le Pen paraît surestimée. Cela ne veut pas dire qu'elle ne se qualifiera pas, car elle dispose d'un socle électoral important, mais le temps joue contre elle. Marine Le Pen est clairement dans une dynamique descendante qui ne se traduit pas encore dans les sondages.

Quelle est précisément votre méthode ?

Tout d'abord, Vigiglobe se défend bien de pronostiquer quoi que ce soit. Nous faisons du big data à partir des données des réseaux sociaux pour révéler des dynamiques sous-jacentes, sachant qu'un français sur deux dispose d'un compte sur Facebook et que Twitter revendique environ 15 millions de comptes ouverts en France. Cette communauté est très importante et riche d'enseignements à l'heure où les sondages traditionnels n'arrivent plus forcément à saisir les dynamiques, ce qui entraîne de grosses surprises comme le Brexit, Fillon aux primaires ou l'élection de Donald Trump.

Nous avons développé des algorithmes basés sur des notions d'intelligence artificielle, qui codent automatiquement le sens et la tonalité de chacun des messages postés sur Facebook et Twitter. Vigiglobe a un signé des partenariats avec Facebook et Twitter, qui nous donnent accès à l'ensemble des tweets publics (hors des messages privés). Cela nous permet d'analyser toutes les données disponibles et de connaître le profil des internautes qui postent (sexe, âge, etc.).

Quant à la tonalité, elle est déterminée par l'apprentissage machine (machine learning). Cela veut dire que nous avons appris à l'ordinateur à discerner s'il s'agit d'un message positif, neutre, ou négatif, par l'analyse sémantique. Un corpus de langage spécialement dédié aux élections a été développé en interne. Nos annotateurs ont codé manuellement des dizaines de milliers de messages pour que l'ordinateur s'en nourrisse et compare chaque nouveau message à ce qu'il connaît. Cela nous permet de déceler aussi l'ironie et l'humour, très répandus sur les réseaux sociaux. La tonalité est très importante pour mesurer les dynamiques autour de chaque candidat, même si la plupart des messages sur les réseaux sociaux sont négatifs. L'analyse du contenu nous permet de délimiter les thèmes qui portent et qui en tirent profit.

Quel crédit apporter à votre méthode ? La sociologie des utilisateurs de Twitter -jeunes, urbains, plus diplômés- ne correspond pas à une photographie exacte des électeurs. De plus, les affaires de François Fillon ont pris d'assaut la campagne, il est donc normal qu'il suscite davantage de réactions sur les réseaux sociaux. Ces éléments ne peuvent-ils pas fausser votre analyse ?

Vous avez raison, Twitter et Facebook ne sont pas la France et il faut rester prudent. Nicolas Sarkozy suscitait énormément de réactions et il ne s'est pas qualifié pour le second tour des primaires. Mais le big data électoral sur les réseaux sociaux vise plutôt à pondérer les sondages en comprenant mieux les dynamiques et en repérant les thèmes, les arguments qui impriment sur l'opinion, en positif ou en négatif. Il ne faut pas oublier que le vote n'est pas rationnel. Le candidat qui marque le plus la campagne par les thèmes qu'il soulève est souvent celui qui gagne. De plus, 5 millions de messages sont publiés chaque semaine à propos des candidats. Ce chiffre double lorsqu'il y a une actualité forte, un débat télévisé par exemple. La population sur les réseaux sociaux représente un tiers des électeurs potentiels, et pas uniquement des jeunes urbains diplômés, surtout sur Facebook. Notre méthode a prouvé sa pertinence pour les marques qui nous utilisent pour déceler les tendances sur lesquelles communiquer, et aussi dans le cas d'élections passées.

Les candidats peuvent-ils « fausser » leur impact sur Facebook et Twitter grâce à leurs armées de militants ?

Les réseaux sociaux sont un relais d'opinion très important pour les candidats s'ils les utilisent bien. Mélenchon et Fillon ont mis en place une véritable stratégie de communication dans ce domaine, qui fonctionne bien. Mais les équipes d'Emmanuel Macron ne sont pas aussi performantes, or c'est lui qui totalise le plus d'intérêt depuis un mois. Marine Le Pen peut aussi s'appuyer sur la fachosphère, très forte, mais elle se situe loin derrière les trois autres. Elle dispose pourtant de la communauté la plus importante : 1,3 million de « likes » sur Facebook, 1,4 million d'abonnés sur Twitter, contre respectivement 350.000 et 500.000 pour Fillon, 280.000 et 650.000 pour Macron, 900.000 et 1 million pour Mélenchon. Donc l'impact de la puissance numérique des candidats sur la Toile est à relativiser.

Qu'est-ce qui retient l'attention des internautes, en positif et en négatif, au sujet de ce quatuor ?

Emmanuel Macron pâtit de l'affaire Mohamed Saou et du fait qu'il soit assimilé à François Hollande. En revanche, il est celui dont les propositions sont les mieux perçues et les plus commentées.

François Fillon est fortement attaqué sur ses affaires et, récemment, à cause de son soutien à Sens Commun. Mais sa stature présidentielle ressort positivement et ses soutiens sont vocaux sur son projet.

Mélenchon bénéficie de la force de sa communauté, très mobilisée pour mettre en avant l'ambition de son programme. Les critiques à son encontre concernent surtout ses propositions, moins sa personne.

Le Pen dispose du ratio soutiens/critiques le plus déséquilibré, elle est beaucoup plus attaquée qu'encensée. Ce qui ressort de positif est sa mise en avant de la France et sa lutte contre l'islamisme radical. Mais elle est très fortement critiquée pour son racisme et ses déclarations sur le Vel d'Hiv.

Quelles tendances avez-vous décelées avant les sondages depuis que la campagne a commencé ?

En janvier, Mélenchon était 4e ou 5e dans les sondages, alors qu'il a très vite été dans le top 3 sur les réseaux sociaux, ce qui a été confirmé ensuite par les sondages. À l'inverse, Benoît Hamon a toujours été loin derrière, même quand il était crédité de plus de 16% d'intentions de vote. Nous avons également observé la baisse de Marine Le Pen avant qu'elle commence à reculer dans les enquêtes d'opinion. Ni ses idées ni ses prises de position ne semblent impacter durablement. Quant à François Fillon, l'argument de « l'élection volée » par les médias et la justice fonctionne très bien. Ses soutiens, souvent des personnes de plus de 50 ans, s'expriment très librement à ce sujet, notamment sur Facebook. Cela paraît fou, mais après trois mois de campagne, nous ne serions pas surpris de voir Fillon qualifié et pas Le Pen.

Que pouvez-vous dire sur les six « petits » candidats ?

François Asselineau dispose d'une communauté assez mobilisée. Cela reste marginal, car il représente environ 3% de l'électorat, mais il est au-dessus de Nicolas Dupont-Aignan sur les réseaux sociaux, ce qui n'est pas le cas dans les sondages. Quant à Philippe Poutou, le buzz après sa prestation du 4 avril est retombé, mais il reste largement au-dessus de Nathalie Artaud.

Un algorithme, Predict my President, qui mouline des données socio-économiques et issues des réseaux sociaux, pronostique un second tour Le Pen-Fillon. Le site Filteris, lui aussi spécialisé dans le big data, estime que Fillon arrivera en tête, devant Le Pen. Votre analyse est encore différente. Qu'en pensez-vous ?

L'arrivée du big data est la principale nouveauté de cette campagne. Je ne peux pas juger des résultats de ces initiatives, car je ne connais pas leur méthodologie. Mais nous avons l'exclusivité des messages sur Facebook et Twitter et un algorithme d'analyse du sentiment qui a prouvé sa pertinence. Encore une fois, il ne s'agit pas de dire que François Fillon sera à coup sûr au second tour et que Marine Le Pen n'y sera pas, mais qu'actuellement, c'est la dynamique qui se dégage, et que celle-ci n'est pas encore traduite dans les sondages. En aura-t-elle même le temps d'ici à dimanche ?

Pensez-vous qu'il faudrait intégrer le big data aux enquêtes qualitatives d'opinion ?

Absolument. Cumuler notre expertise avec celles que vous mentionnez permettrait de mieux saisir l'opinion et d'affiner les études. Il manque un acteur qui synthétiserait tout cela et l'analyserait. Notre approche, celles de nos concurrents dans le big data et celle des sondages sont complémentaires et devraient être fusionnées. Si tel était le cas, le défi serait alors de déterminer le poids que l'on attribue à chacun de ces facteurs. Comment pondérer les résultats des sondages avec les données des réseaux sociaux et les statistiques socio-économiques ? Les chercheurs pourraient nous aider à trancher.

Propos recueillis par Sylvain Rolland