L’open data à l’heure de la maturité en France

 |   |  775  mots
(Crédits : DR)
L’ouverture des données publiques s’étend à des champs de plus en plus larges et prometteurs, comme la santé. La nomination d’un administrateur général des données en septembre a accéléré le mouvement au sein de l’Etat et les startups, comme celles retenues au concours Dataconnexions qui décerne ses prix ce jeudi, développent des applications au potentiel business plus marqué.

L'année 2014 a été déterminante pour la France en matière d'ouverture publique des données : adhésion au mouvement Open Government Partnership et nomination en septembre d'un « Chief Data officer » ou « administrateur général des données », Henri Verdier, également directeur de la mission Etalab. Rattachée au Premier ministre, cette dernière pilote la politique d'ouverture et de partage des données de l'Etat, des établissements publics, et des collectivités si elles le souhaitent. A la veille de la cérémonie de remise des prix du concours Dataconnexions, organisé par Etalab, qui récompense les meilleures innovations fondées sur l'ouverture des données publiques, Henri Verdier partage sa satisfaction de voir ce mouvement prendre de l'ampleur.


« La transparence que permet l'open data est devenue une routine, à l'image de la publication de la réserve parlementaire » se félicite Henri Verdier. « L'open data c'est la transparence, c'est aussi une ressource pour l'innovation et une source d'amélioration de l'efficacité de l'administration. »


Ces trois volets sont représentés dans les candidatures à la cinquième édition de Dataconnexions : 63 dossiers présentés et 20 retenus pour « pitcher » en public jeudi, après plus de 3.000 votes en ligne du grand public. Pas de récompense financière à la clé pour les gagnants mais une mise en avant qui peut donner un vrai coup de pouce. Le jury est composé de professionnels, directeurs d'administrations, d'investisseurs en capital-risque, de journalistes spécialisés, de cadres de grands groupes (La Poste, Orange) etc.

« Ce concours est un indice de la maturité de l'écosystème » estime le directeur général d'Etalab.

Les startups candidates au concours ont compris « qu'il faut apporter de la valeur ajoutée, sinon ce n'est pas la peine de créer une boîte. » Il y a ainsi beaucoup de projets « BtoB », destinés à un usage professionnel, comme CommoPrices, un portail de cours des matières premières, Splayce, un traitement de texte intégrant les textes juridiques, Contracteo, un outil d'aide à la rédaction des contrats de travail. Dans la catégorie des projets portés par des acteurs publics, on trouve celui de la petite commune de Brocas (Landes), devenue mythique dans la communauté Open Data pour avoir décidé d'ouvrir toutes ses données, et celui de l'agence régionale de santé de PACA pour sa datavisualisaton des dépenses de santé.

« On aborde cette année des questions robustes, telles que la santé. On n'est plus seulement dans la transparence mais dans la science » se réjouit Henri Verdier. « Le plus gros boulot devant nous dans l'open data se situe dans la santé : c'est de l'or en barre, pas pour le business mais pour l'épidémiologie, l'amélioration du parcours de soin, etc. En revanche, c'est aussi de la vie privée en barre ! Il faut donc préparer de grands jeux de données anonymisés. »


Fin janvier, un hackaton a été organisé par l'Assurance maladie, qui a donné accès à son immense base de données Damir (650 gigaoctets d'informations !), reprenant tous les actes thérapeutiques, hors hôpital. Vingt équipes se sont affrontées et ont soulevé « des questions très malines » par exemple va-t-on plus chez le médecin si l'offre de soins est plus abondante?


L'administrateur général des données s'est donné un an pour définir sa fonction et Institutionnaliser cette administration. Il a déjà recruté 4 « data scientists », veut repérer des profils similaires dans l'administration et creuser des « sujets concrets » : ainsi des discussions sont en cours avec Bpifrance pour mesurer l'impact des aides et voir comment le maximiser sur l'écosystème. Sur les achats publics, il pense que l'on peut réaliser des économies « ciblées » en identifiant des multitudes de petits gaspillages. Il tient déjà au moins une réalisation concrète: la base d'adresses nationale, géolocalisée, conçue en partenariat avec La Poste, l'IGN, le cadastre et les bénévoles d'Openstreetmap, sur la base d'un partage à l'identique (et non d'une réutilisation libre, la licence Etalab), dévoilée en novembre dernier.

« On a réussi à convaincre la Poste de renoncer à sa base de codes postaux qui lui rapportait 1 million d'euros par an. On évangélise, on rassure, on donne des exemples » explique Henri Verdier.

Et l'administrateur général des données de prévenir :

« S'il y a une chance de résister à Google en Europe c'est avec Openstreetmap.»


Cette carte mise à jour par 2 millions de contributeurs bénévoles est utilisée notamment par le Samu, les services de protection de personnalités, les aménageurs publics.

Réagir

Votre email ne sera pas affiché publiquement
Tous les champs sont obligatoires

Commentaires
a écrit le 12/02/2015 à 18:44 :
c'etait pas ce que je voulais dire!
j'ai dit ' les boites croient qu'un logiciel sait ce qu'elles ne savent pas, car un logiciel est intelligent, et un homme idiot'
donc on embauche des bac, bac-2 ( avec doctorat en maths) qui utilisent des logiciels omniscients, puis on gemit de la mediocrite de la technologie quand on voit les resultats qui sortent...
si c'est plus clair comme ca...
( c'est aussi le cas avec les erp, les aps, etc...)
a écrit le 05/02/2015 à 9:15 :
avant, un ' data scientist', ca s'appelait ' statisticien'
on apprenait pdt de longues et penibles etudes la realisation des etudes, outis divers et varies, methodologie, etc...
maintenant on a des logiciels qui savent tout, et sinon des ingenieurs qui savent coder.... triste monde dans lequel on vit !!!
Réponse de le 05/02/2015 à 10:52 :
Il faut vivre avec son temps...
a écrit le 05/02/2015 à 8:58 :
« S'il y a une chance de résister à Google en Europe c'est avec Openstreetmap.» : Baser les infrastructures sur des bases de données en licence ODbL reviendrait à baser les logiciels libres sur des briques en licences GPL.
L'OpenData ferait bien d'observer l'histoire du logiciel libre où les entreprises ont finalement pris conscience qu'il était préférable de se passer de la protection des licences en partage à l'identique plutôt que de s'interdire des pistes d'exploitations du bien commun.
Si la données de référence est utilisée, l'utilisateur à tout intérêt à apporter des corrections quand il détecte un bug. Sinon, il fait un fork qui le prive des corrections des autres!
En outre, ODbL ne protège pas les contributeurs contre les réutilisations "parasites". Les purs utilisateurs de données peuvent consommer sans participer.
L'intérêt de la licence ODbL est ailleurs : Attirer les données liées des contributeurs qui voudraient participer au socle commun et profiter de leurs contributions sur ce socle commun.
On peut défendre le principe, il faut toutefois en mesurer les impacts : De nombreuses entreprises seront privées de l'utilisation des données libres. Elles ne pourront donc pas contribuer à en améliorer la qualité. Pourquoi? Elles ne peuvent pas prendre le risque de devoir ouvrir toutes leurs données soit pour des raisons financières (un annuaire est parfois un gagne pain, soit pour des raisons stratégique (base de données clients revendu au publicitaires).
Pour un réelle efficacité économique de l'OpenData, il faut que les données de références (adresse, cadastre, etc.) soit sous licence libre Etalab ou équivalente. Observez l'histoire du logiciel libre : On a ré-écrit les briques en GPL pour enlever les contraintes! On risque bien de vivre le même phénomène dans quelques années sur des données libres d'attirer les autres dans OSM!
LICENCE PUBLIQUE ETALAB SUR LES DONNEES DE REFERENCE! PAS DE LICENCE OUVERTE MAIS PAS TROP!
PS : Si un vandale supprime ma rue dans OSM, le SAMU me laisse crever?

Merci pour votre commentaire. Il sera visible prochainement sous réserve de validation.

 a le à :