Big data et élections : les menues escroqueries intellectuelles de Filteris

 |   |  1754  mots
(Crédits : © Gonzalo Fuentes / Reuters)
Afin de sauver le candidat Fillon, les sondages d’intention de vote ont été dénigrés et de pseudo métriques ont été artificiellement valorisées pour faire advenir une réalité que le scrutin a démentie. Par Arnaud Mercier, Université Paris II Panthéon-Assas

Dans le climat de dénigrement systématique des sondages durant cette campagne présidentielle française, un acteur nouveau est apparu : les agences d'étude des messages publiés par les internautes sur leurs comptes de réseaux sociaux. Même si cette activité existe depuis une petite dizaine d'années, la visibilité que certains médias et candidats leur ont donnée est inédite.

Ces agences qui scrutent ce qui dit sur ces réseaux ou qui incitent les gens à venir s'exprimer sur leurs plateformes ambitionnent toutes de transformer ces messages en des métriques sociales, des données chiffrées qui objectiveraient le rapport de force entre les candidats, en terme de poids relatif de la conversation en ligne concernant chaque candidat.

Et le désespoir pathétique des militants les plus durs de la droite filloniste les a conduits à s'accrocher, telle une bouée de secours en pleine tempête, à ces statistiques nouvelles livrées par des sociétés qui ont ainsi connu leur heure de gloire dans la presse engagée à soutenir François Fillon, au premier rang desquels l'appli YouGOV ou Filteris, société canadienne animée par des Français.

On a ainsi vu gonfler sous nos yeux ébahis un microécosystème, articulant dans des liens réciproques de promotion croisée l'équipe de campagne de François Fillon, les sites d'information les plus à droite et quelques sociétés en mal de reconnaissance et de publicité. Microécosystème qui avait finalement tout d'une petite arnaque intellectuelle entre amis.

Dévoiement de la mesure numérique des conversations sociales

Démontons donc cette tentative de manipulation de l'opinion qui prit pour cible les sondages d'intention de vote en s'appuyant sur des pseudo concurrents pour essayer de donner vie à une réalité inverse de celle que les sondages donnaient à voir. Celle-là même que le scrutin a confirmée, puisque les sondages ne sont pas trompés, donnant le quinté des candidats dans l'ordre exact et avec des chiffres compris dans les marges d'erreur.

Cette mesure de la conversation sociale est très utile, très instructive. Elle fut utilisée dans bien des élections passées en France. Nous avons nous-mêmes conduit en 2014 une étude pour établir un baromètre de la tweet-campagne des municipales sous l'égide de France Info et sous la houlette de la société d'étude Semiocast.

Pourtant en 2017, les thuriféraires de ces mesures en période électorale en ont dévoyé totalement le sens en se positionnant comme des concurrents directs des sondages d'intention de vote, au lieu de rester prudemment dans une position de complémentarité. Le journal Valeurs actuelles en a fait un baromètre quotidien concurrent des sondages, publiant chaque jour le nouveau graphique publié par Filteris. Le site Atlantico s'est engouffré dans la même voie qu'il croyait être une brèche, donnant une forte visibilité à des métriques qui ne peuvent pas dire ou prédire ce pour quoi elles ne sont pas conçues, à savoir : exprimer un vote !

« Depuis plusieurs semaines, toutes les analyses big data donnent invariablement François Fillon vainqueur de cette présidentielle, qu'il s'agisse de Filteris, ElectionScope, YouGov et Multivote, ou plus simplement des sondages appelant les internautes à faire un choix... Même si elles ont déja démontré leur pertinence (élection de Trump, Brexit, primaires de la droite et du centre), ces analyses attirent systématiquement les critiques des sondeurs et celles des partisans d'Emmanuel Macron. »
Atlantico (1er avril 2017).

Sous le titre « Un sondeur annonce que Fillon sera au second tour », qui introduit un coupable brouillage des repères, puisqu'il ne s'agit pas du tout d'un institut de sondage au sens classique, Valeurs actuelles publia le 17 avril, un article commençant ainsi :

« Interrogé sur France Info, mercredi 12 avril, le cofondateur de l'application GOV, qui sonde gratuitement des milliers de Français, annonce que « François Fillon sera au second tour ». Il ajoute : « N'en déplaise aux principaux instituts qui les font, les sondages traditionnels ont montré leurs limites. Réalisées presque quotidiennement auprès d'un nombre de personnes réduit, ces études particulièrement prisées en période électorale ont déjà prouvé qu'on ne pouvait pas s'y fier, comme l'a montré l'élection de Donald Trump aux États- Unis. »

Que des journaux qui ne cachent pas leur posture militante de droite s'adonnent à des articles visant à dénigrer les sondages, à instiller le doute sur ce qui se dit de défavorable au sujet du candidat qu'ils soutiennent, c'est n'est pas très honnête intellectuellement mais après tout attendu. Que, cruellement démenti par les faits, cela ne les amène pas à faire amende honorable et à s'excuser auprès de leurs lecteurs d'avoir accrédité de telles fables est en revanche bien triste.

Mais il est plus intéressant de s'occuper des soubassements factuels et intellectuels des sociétés elles-mêmes, en prenant pour cas d'école les postures des responsables de Filteris.

Filteris, une pseudo martingale instrumentalisée par le bunker Fillon

Leurs porte-parole véhiculent depuis des mois un argumentaire à géométrie variable servant à la fois à s'autopromouvoir comme des visionnaires quand cela les arrange et à réfuter les critiques quand ils sont pris en faute de prévision. Puisque des semaines durant, il a été question d'opposer ces « vraies » métriques aux « mauvais » sondages, rappelons graphiquement la cruelle réalité.

À titre d'exemple, voici le sondage IFOP du 21 avril 2017 :

DR

Et voici les résultats officiels du ministère de l'Intérieur :

  • Emmanuel Macron : 24,01

  • Marine Le Pen : 21,3

  • François Fillon : 20,01

  • Jean‑Luc Mélenchon : 19,58

On constatera que Macron était surévalué de 0,5 point, Le Pen surévaluée de 1,3 point, Fillon sous-estimé de 0,5 point et Mélenchon sous-estimé de 1 point. Tout est donc parfaitement compris entre les marges d'erreur et est, en vérité, précis, puisque c'était le quarté gagnant. Que donnaient aussi d'autres instituts d'ailleurs. Comparons maintenant avec l'ultime métrique de Filteris, le 21 avril :

Filteris 21 avril 2017.

Avec les indications de Filteris, pas un seul des candidats n'est à sa vraie place. Je n'irai pas jusqu'à calculer les points d'écart entre cette métrique et celle du scrutin, puisque cela ne mesure pas la même chose ! Ce serait aussi ridicule que d'essayer de faire une comparaison entre des taux de chômage et un taux de satisfaction des services de Pôle emploi calculé à partir de la conversation sociale sur Twitter et Facebook. Enivrés par ce qu'ils croient être la performance prédictive du vote, de leur outil, les responsables de Filteris se sont livrés à ces comparaisons aussi douteuses qu'absurdes sur leur site.

Commençons par leur griserie des sommets :

buzzpol.

Ce discours leur faire croire qu'ils rivalisent de plain-pied avec les sondages. D'ailleurs, ils s'intègrent sans vergogne dans un classement comparatif en dressant une égalité de valeur entre des chiffres qui n'ont jamais mesuré la même chose :

Buzzpol correlation image scrutin.

En étudiant d'un peu plus près leur discours autopromotionnel, on démasque assez vite la supercherie.

Dans une interview avec un très complaisant André Bercoff (collaborateur régulier de Valeurs actuelles), sur le plateau de Sud Radio, une des responsables de Filteris, Véronique Queffelec affirme que grâce à leurs collectes de millions de données et à l'identification de la sentimentalité des messages émis, les responsables de Filteris peuvent établir un classement. Et elle déroule :

« Attention, on a aussi un pourcentage possible d'erreur, mais en général on est quand même assez près du résultat. Déjà en 2007, alors que cette technologie en était à ses balbutiements, le premier tour des élections présidentielles françaises, nous avons trouvé Bayrou à 18,6, il a fait 18,57 et les sondeurs à la même époque le donnaient à 10 ! (...) Sur la primaire de droite, nous avons dès le 12 octobre dit que F. Fillon serait au deuxième tour, le 13 octobre un institut de sondage le plaçait en quatrième position. (...) De même, nous ne sommes pas trompés pour l'élection de Trump, (...) un mois avant nous avions annoncé la probabilité de l'élection de Trump, de sa victoire ! »

Les hauts faits d'armes s'accumuleraient donc : Filteris donne souvent des métriques de conversation sociale dont le chiffre est très proche du résultat du vote ; Filteris prévoit les résultats un mois à l'avance ; Filteris donne des chiffres justes à des moments où les sondages, eux, sont totalement largués.

Filteris et ses pathétiques justifications en cas d'erreur

Mais, alors, comment expliquer des erreurs de prévision cruelle comme par exemple, cas d'école, la primaire de gauche où l'outsider Benoît Hamon a été complètement raté par Filteris ?

Filteris primaires de gauche.

La réponse est simple, elle est apportée dans un message posté sur le Facebook de la société le 19 février. Au commentaire perfide d'un internaute qui leur écrit : « Tiens, les petits génies de Filteris au gros melon se plantent aussi », la société répond :

reponse Facebook filteris.

Ainsi quand leur fumeuse martingale correspond plus ou moins au résultat final un mois avant, ils en tirent gloire en en faisant un argument décisif de supériorité face aux sondages et quand leur résultat est démenti, ils se justifient en disant que des « variations importantes » peuvent intervenir « et ce très rapidement ». Bref, ils sont très bons car eux sont des visionnaires et voient des choses un mois avant tout le monde, et quand ils sont mauvais, c'est qu'il faut tenir compte du temps qui change le cours des choses jusqu'au dernier moment.

Filteris, ivre de ses soi-disant prodiges passés, a entretenu la flamme de ceux qui leur octroyaient en échange une publicité aussi imméritée qu'inespérée, en instrumentalisant un outil de métrique sociale fumeux et complètement dévoyé de ce à quoi il pourrait utilement servir, pour essayer de faire croire à une victoire électorale qui leur échappait. Durant cette fin de campagne chacun a grisé l'autre. Mais les masques sont tombés en même temps que les résultats : le « vote caché » et Filteris sont nus et François Fillon est resté scotché à la troisième place que lui octroyaient tous les sondages. Les vrais !

The Conversation ________

 Par Arnaud Mercier, Professeur en Information-Communication à l'Institut Français de presse, Université Paris II Panthéon-Assas

 La version originale de cet article a été publiée sur The Conversation

Réagir

Votre email ne sera pas affiché publiquement
Tous les champs sont obligatoires

Commentaires
a écrit le 30/04/2017 à 10:40 :
Article totalement partisan d'un anti-Fillon. Je ne suis pas défenseur d'une méthode de sondage plutôt qu'une autre mais il sidérant de voir comme cet article est à charge et ne fait preuve d'aucune objectivité. L'auteur étale ses titres sur 4 lignes mais ferait mieux de passer du temps à travailler davantage l'honnêteté intellectuelle.
a écrit le 29/04/2017 à 16:20 :
La supercherie du big data n'a pénalisé que le candidat malveillant qui voulait en profiter.
Il s'appuyait sur des sondages trafiqués mais malgré ses allégations "je serai au second tour" (le figaro), il a été éliminé et donc puni. La morale est donc sauve: bien mal acquis ne profite jamais.
a écrit le 29/04/2017 à 10:57 :
L'écart entre les sondages,les analyses big data et les résultats n'est pourtant pas si important pour en tirer des conclusions si péremptoires que le fait l'auteur de l'article.
a écrit le 29/04/2017 à 7:47 :
maintenant il n y a plus de sondage et j'espère qu'il en sera ainsi jusqu'au 2ème tour
a écrit le 28/04/2017 à 22:56 :
Les erreurs des sondages ont laissé la porte ouverte à de nouveaux acteurs liés au domaine de la prédiction c'est logique maintenant il est quand même maladroit de dénoncer ces nouveaux outils, ce qui est légitime, en les comparant avec d'autres outils liés à la prédiction qui se sont t lourdement plantés en 2016.

Même s'il peut s'avérer intéressant de chercher à anticiper ce que vont faire les gens les sondages restent une façon d'imposer la pensée générale à tous et les déviances qui vont avec dont le fait de faire comme tout le monde. Leur utilisation ne devrait être limitée​ qu'au bien commun et à rien d'autre.
a écrit le 28/04/2017 à 19:05 :
fichtre, on sait pour qui elle ne vote pas, la dame!!!!
dans une campagne ou l'intox et le caniveau etaient roi, il valait mieux faire comme les autres.........
apres , effectivement, on peut faire dire n'importe quoi a n'importe qui, voire se planter dans la methodologie ( de facon sciente ou pas) ... y a des exemples celebres au etats unis au debut de siecle dernier....
moi je vous met ma main au feu que lepen macron, c'est pas 40/60 comme frequemment indique....
dans le cas ou ca ne serait pas le cas, on espere ex post un papier aussi virulent!
Réponse de le 28/04/2017 à 19:50 :
La vérité est dure a entendre mais ne vous découragez pas, relisez le texte lentement et les neurones finiront par se connecter.
Réponse de le 27/05/2017 à 9:44 :
Gagné ! Ce n'était pas 40/60 mais 34/66

Merci pour votre commentaire. Il sera visible prochainement sous réserve de validation.

 a le à :