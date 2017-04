Les deux qualifiés pour le second tour de la présidentielle seront Marine Le Pen avec 24,13% des voix et... François Fillon avec 21,77%. Emmanuel Macron arrivera en troisième position avec 20,32%... Sondage ? Fiction ?

Non, ces résultats sont le fruit d'un astucieux et ambitieux projet dénommé « Predict the Président », mené depuis plusieurs mois par cinq étudiants de l'école Telécom Paris Tech pour le compte de l'hebdomadaire Le Point. Les élèves ont bâti un programme mélangeant des données numériques (Google et Twitter) et des données socio-économiques remontant jusqu'à 1981 (taux de chômage par département, résultats des élections locales, etc.), issues de l'open data via des plateformes gouvernementales et l'Insee. Le tout a été rapproché des résultats électoraux depuis 1981. Puis, en paramétrant des algorithmes, ils sont donc arrivés à cette prédiction.

Les "failles" des sondages traditionnels

Interrogés par Le Point, deux des étudiants, Mohamed Al Ani et Raphaël Vignes, expliquent que l'analyse de l'étude des buzz sur Twitter et sur Google « permet d'ajouter une composante de popularité des candidats et d'image publique [...]. Ainsi, grâce à ces nouvelles données nous pouvons collecter une tendance personnalisée et instantanée de l'opinion des internautes et de la twittosphère. Nous avons là, la rencontre d'une femme ou d'un homme avec le peuple numérique ».

Les deux étudiants expliquent aussi, les « failles » des sondages traditionnels :

« Comme nous avons pu le voir dans des enquêtes récentes, les instituts de sondage ont quelques failles dans leurs approches, les enquêtes téléphoniques sont délaissées pour des enquêtes internet rémunérées sans pouvoir vérifier l'identité de l'administré, tant et si bien que certains mentent pour être sûrs d'être interrogés et percevoir la rémunération. En effet, selon la méthode des quotas il faut atteindre une certaine taille d'effectif dans chaque catégorie interrogée. Et certains profils sont plus rares que d'autres. En outre, les instituts de sondage ne déclarent pas les chiffres bruts qu'ils obtiennent ni leurs méthodes de redressement, technique qui consiste à corriger les résultats des enquêtes jugés non pertinents par les instituts. Une simple commission juridique s'assure que les redressements sont valides, mais n'a jamais prononcé la moindre sanction à leur encontre.»

Cependant, les étudiants reconnaissent que leur programme a lui aussi encore des failles car leur méthode expérimentale repose sur l'hypothèse que le comportement des électeurs du passé sera similaire à celui des électeurs du futur. On verra dimanche soir à 20 heures si les prédictions des cinq étudiants se sont avérées exactes.