Open Data : la base Sirene, un trésor de données à explorer

Pendant une journée, l’Insee et Etalab ont ouvert à des développeurs, des data scientists et divers porteurs de projets une partie de l’immense base de données Sirène de l’Insee, qui comprend 10 millions d’établissements et 9 millions d’entreprises. L’objectif : prouver l’utilité économique de l’Open Data en créant une flopée de nouveaux services grâce à cette base qui deviendra totalement libre d’accès dès janvier 2017.
Sylvain Rolland
Annuaire des entreprises de France, meilleure indemnisation des entreprises victimes de calamités agricoles, outils pour implanter son entreprise... Pour fêter l'ouverture imminente de la base Sirene de l'Insee, des geeks ont imaginé des nouveaux outils grâce aux données ouvertes.

Mardi 15 novembre, 19 h, une longue journée se termine au SenseCube, un incubateur situé dans le douzième arrondissement de Paris. Depuis 9 h du matin, une cinquantaine de geeks, startuppeurs, développeurs web, data scientists et autres porteurs de projets, se creusent les méninges pour exploiter la richesse de la base de données Sirene, qui appartient à l'Insee.

C'est une première : jusqu'à présent, l'accès à cette base, qui regroupe 10 millions d'établissements et 9 millions d'entreprises, était payante, sujette à une redevance versée actuellement par une soixantaine d'acheteurs, selon Etalab. Mais à partir du 4 janvier 2017, dans le sillage du mouvement d'ouverture des données publiques (open data) poussé par les récentes lois Lemaire et Valter, le fichier Sirene deviendra totalement gratuit. Tout le monde pourra accéder aux millions de données sur les entreprises françaises (localisation, secteur d'activité, tranche d'effectifs, caractéristiques juridiques, raison sociale...), dans un format qui facilite leur extraction et leur réutilisation.

Pour le directeur général de l'Insee, Jean-Louis Tavernier, il s'agit d'une "petite révolution":

"La base Sirene présente la cartographie la plus complète du tissu économique français. Ces données sont de l'or. En les exploitant, en les couplant avec d'autres bases de données publiques, on peut stimuler créer de nombreux nouveaux services, à la fois pour les entreprises et les collectivités, et créer une véritable économie de la donnée".

Améliorer le service public grâce à la donnée

Pour ce galop d'essai, l'Insee a mis à la disposition des participants du hackathon des données datant de juin et de juillet 2016. En moins de neuf heures, huit équipes ont créé des nouveaux services astucieux, à la fois à destination des collectivités et des entreprises, dont certains sont amenés à être développés par la suite.

C'est le cas, par exemple, de cette nouvelle application de gestion des calamités agricoles, destinée aux fonctionnaires du ministère de l'Agriculture. Mise au point par deux responsables techniques du ministère et par trois geeks qui se sont joints au projet en début de matinée, cette application permet de mieux cibler les entreprises victimes d'une catastrophe naturelle, pour accélérer leur indemnisation. Pour Damien Tricoche, responsable technique au ministère, il s'agit d'améliorer la qualité du service public:

"La base Sirene nous sert à identifier, sur une zone géographique touchée par une tempête par exemple, les entreprises qui pourraient en être victimes, par secteur d'activité. Ce ciblage permet à nos équipes de les contacter rapidement pour les indemniser, et ainsi limiter l'impact de la catastrophe sur leur activité. On peut même imaginer une application qui nous permettrait de prévenir les entreprises de l'imminence d'une catastrophe, pour qu'elles puissent l'anticiper. C'est une nouvelle conception du service public".

Mieux comprendre les bassins d'emplois, agir contre le chômage

D'autres groupes ont décidé de réutiliser les données Sirene pour mieux comprendre le tissu économique. Et donc développer des outils pour lutter contre le chômage, affiner la connaissance des entreprises, tirer des enseignements des échecs et des succès, accentuer les dynamiques positives...

"Les collectivités dépensent 5 milliards d'euros par an pour le développement économique. L'ouverture des données Sirene permet de mieux comprendre ce qui fonctionne ou pas", explique Pierre, un développeur. Son équipe a mis au point, dans la journée, un outil à destination des collectivités pour analyser la dynamique des créations d'emplois sur un territoire, par secteur d'activités.

Un autre groupe a préféré créer un "annuaire des entreprises de France". L'idée : regrouper les données Sirene avec celles d'Infogreffe (qui sont partiellement ouvertes) et de l'Institut national de la propriété intellectuelle (Inpi). L'outil permet, pour chaque entreprise de France, de créer une fiche détaillée avec son adresse, sa raison sociale, son domaine d'activité, sa tranche d'effectif, mais aussi ses brevets et ses informations légales. L'ajout d'un "mapping" permet de géolocaliser les entreprises sur une cartes, puis d'effectuer des recherches plus précises. Autant d'analyses microéconomiques qui peuvent se révéler précieuses pour les pouvoirs publics.

Les données Sirene peuvent aussi être exploitées au bénéfice des particuliers et des entreprises. Un entrepreneur qui souhaite implanter sa boutique d'habillement, par exemple, pourrait savoir exactement, grâce à la géolocalisation des boutiques concurrentes et au calcul de la densité nombre d'habitants / nombre de boutiques, où s'installer et quelles zones éviter. De son côté, l'appli Boost Emploi, également développée sur la journée, propose d'aider les chômeurs à trouver un emploi ou encore une région, grâce à l'analyse des données APE (activité principale exercée) des entreprises.

L'Open Data pourrait dynamiser la croissance du PIB

"Les applications sont presque infinies, plus les startups et le public se saisiront des données publiques ouvertes, plus ils pourront créer de nouveaux usages et développer l'activité économique", estime Jean-Louis Tavernier.

Selon Etalab, l'open data pourrait gonfler la croissance du PIB entre 0,5 et 1,5 point, en gains directs ou indirects. "On ne mesure pas non plus comment les PME peuvent utiliser les données publiques pour améliorer leur business et en créer de nouveaux", ajoute Axelle Lemaire, la secrétaire d'Etat au Numérique et à l'Innovation, présente lors du hackathon.

Le mouvement est déjà bien engagé. La loi pour une République numérique, dont les décrets d'applications sont publiés en ce moment, rend obligatoire la mise à disposition par défaut de toutes les données des administrations, des collectivités et des agences publiques. Autant de leviers d'opportunité pour les startups en quête de nouveaux filons.

Sylvain Rolland

Sujets les + lus

|

Sujets les + commentés

Commentaire 0

Votre email ne sera pas affiché publiquement.
Tous les champs sont obligatoires.

Il n'y a actuellement aucun commentaire concernant cet article.
Soyez le premier à donner votre avis !

-

Merci pour votre commentaire. Il sera visible prochainement sous réserve de validation.