La Tribune

L'Open Data est à la mode et... cherche son modèle

Copyright Reuters
Copyright Reuters
Erick Haehnsen  |   -  1430  mots
Dans un mouvement planétaire parti des États-Unis, gouvernements, administrations et collectivités rendent publiques certaines de leurs données. De quoi favoriser l'émergence de start-up technologiques qui collectent, analysent et enrichissent ces données. Mais le marché n'est pas là où on l'attendait.

Il y a cinq ans, le gouverneur du Massachusetts avait exigé que les sociétés de transport public ouvrent et partagent leurs données. Objectif : permettre aux usagers de prendre connaissance des horaires et des correspondances entre les différents opérateurs. Une décision en apparence anodine qui a, en fait, ouvert la voie à l'Open Data, autrement dit aux données publiques accessibles sur le Web. Car cette initiative s'est alors répandue à grande vitesse à travers les États-Unis, sous l'impulsion notamment du président Barack Obama, avec son projet Open Government qui voulait « libérer » les données de toutes les agences du gouvernement fédéral. Détail essentiel : ces données publiques pouvaient être réutilisées gratuitement.
Tous les ingrédients étaient dès lors réunis pour favoriser l'émergence d'un écosystème de start-up créatrices de technologies et de services innovants qui permettent de reconditionner les données avant de les revendre. Des données qui, bien exploitées, peuvent valoir des milliards de dollars. En très peu de temps, l'Open Data est donc devenu un mouvement planétaire.
C'est ainsi qu'à partir de 2010 ont émergé aux États-Unis les places de marché de données comme Data-market, Factual, Infochimps, Kasabi ou Windows Azure Data Marketplace. En France, on compte Qunb et Data Publica. Leur principe est simple : extraire d'énormes jeux de données publiques, par exemple les horaires des transports publics d'une ville et de sa région. Et en faire de l'or en les croisant, le cas échéant, avec d'autres données, le plus souvent géographiques ou socioprofessionnelles. Quitte à effectuer, au préalable, des opérations de nettoyage des doublons ou des données obsolètes, à les enrichir avec d'autres données, à les mettre en forme de façon graphique (voire interactive), à rendre anonymes les profils des particuliers pour, enfin, les rendre accessibles sur le Web. De quoi faciliter leur réutilisation par d'autres organismes publics ou... par les services marketing des entreprises.
Parmi les pionniers, Infochimps, aux États-Unis, ne tarde pas à afficher des milliers de jeux de données dans plus de 200 rubriques (codes postaux, numéros de téléphone, etc.), dans un grand nombre de secteurs d'activité. La start-up islandaise DataMarket se spécialise, quant à elle, dans le domaine des énergies alternatives. La France n'est pas en reste. Ainsi, Qunb s'est dotée de puissants algorithmes capables de rechercher parmi 2.000 sources de données à 95% gratuites (Open Data et données générées par les utilisateurs). Les 5% restants étant des études de marché produites par les grands cabinets d'analyse comme Gartner, Xerfi ou Eurostaff, vendues « à la découpe »... De son côté, Data Publica a proposé de réaliser des jeux de données à la demande pour ses clients.

Les « données massives » les ont sauvés

Mais tout cela, c'était avant... Car la plupart des données publiques se sont révélées austères, incomplètes, délivrées dans des formats inutilisables (en PDF, par exemple), insuffisamment abondantes et pas franchement palpitantes. Des carences fatales à Factual et à Kisabi, qui ont fermé leurs portes. En revanche, Datamarket, Data Publica, Infochimps et Qunb ont survécu grâce aux outils logiciels en ligne pour le Big Data, ou « données massives », comme, par exemple, les flux continus de données en temps réel qui servent à mesurer l'e-réputation ou à analyser la demande via des réseaux sociaux comme Twitter ou Face-book. Des données trop volumineuses pour être traitées avec les logiciels classiques. Bref, de l'Open Data, les start-up survivantes sont passées au Big Data.
Infochimps enrichit ainsi la valeur initiale des données de Koupon Media, un opérateur américain de bons de réduction délivrés sur smartphones, avec des données démographiques (sexe, âge, catégories socioprofessionnelles). Un avantage compétitif pour ses clients de la grande distribution, pour qui la start-up peut réaliser des campagnes mieux ciblées. De son côté, DataMarket soigne tout particulièrement la présentation des données avec des graphiques interactifs et très colorés (Data Vizualisation ou Dataviz). Pour 59 dollars par mois, chefs d'entreprises, directeurs marketing, journalistes et analystes appréhendent ainsi facilement les informations dont ils ont besoin. Quant aux producteurs de données, ils accèdent à un moyen efficace de publier leurs chiffres et d'élargir leur audience sur le Web. La Data devient enfin « sexy ».En France, ce message est reçu 5/5. Les start-up Qunb et Data Publica viennent tout juste d'adopter la stratégie à la fois d'Infochimps (Big Data, Data Mining et Business Intelligence, ou informatique décisionnelle) et de DataMarket (Data-viz). S'adressant au départ aux journalistes, Qunb se spécialisait dans le partage et le traitement des données chiffrées extraites de l'Open Data. Depuis décembre, la start-up s'intéresse aux acteurs qui ont des données à partager plutôt qu'à ceux qui en cherchent. Objectif : devenir le « Youtube des données ».D'autres start-up ne se sont pas embarrassées de la coûteuse production de données. Aux États-Unis, Good Data, OpenLink Software et Tableau Software sont devenues expertes dans la gestion, la collecte et l'intégration des données et dans la Dataviz. Certaines spécialisations sont très pointues. Datasift et Gnip, par exemple, sont championnes de la récupération et de l'analyse des flux de données provenant de Twitter. Sur ces créneaux, la France est particulièrement fertile, avec les start-up Altic, Captain Dash, Dataveyes, Mesa-graph ou OpenDataSoft. À tel point que l'Open Data et le Big Data sont devenus un axe stratégique de développement du pôle de compétitivité System@tique, spécialisé dans l'innovation logicielle et le logiciel libre.
Captain Dash, par exemple, mise sur l'utilisation de ses technologies à des fins marketing. « Nous nous adressons aux services marketing des sociétés du Fortune 100 et du CAC 40 », explique Gilles Babinet, ancien président du CNN (Conseil national du numérique) et actuel président de la start-up (30 salariés), qui milite également en faveur du « mix des données », à savoir le mélange des données marketing internes à une entreprise et des données externes (météo, environnement et santé, résultats électoraux, cours de la Bourse, audience média, trafic routier, etc.). « Les segmentations marketing traditionnelles ne prenaient en compte que des moyennes. Ici, la "granulométrie" est si fine qu'on analyse des comportements presque individuels! L'analyse colle davantage à la réalité. » Une station d'essence pourrait ainsi proposer par smart-phone des promotions géolocalisées sur les glaces ou boissons fraîches lors d'un soudain embouteillage à proximité... Pour diversifier la collecte des données et accélérer leur traitement, Webshell, une autre pépite française, propose une plate-forme qui facilite la création d'applications innovantes sur le Web grâce à des API (interfaces de programmation) qui permettent l'interaction des programmes les uns avec les autres.
Le phénomène API croît de façon exponentielle : en 2000, on en comptait 2?000. Aujourd'hui, il y en a 8.014, selon l'étude Six Reasons Why APIs Are Reshaping Your Business, de FaberNovel. Laquelle nous apprend que Twitter enregistre 13 milliards d'appels par jour au travers de ses API! 90% des ventes du site de voyage Expedia se font au travers d'API. Microsoft mise en tout cas sur l'émergence de ces interfaces : le géant a lancé sa plate-forme Windows Azure Marketplace qui rassemble non seulement de l'Open Data et de la Data-viz mais aussi des applications venues de développeurs tiers.

1,8 million d'annonces agrégées et enrichies

Les nouvelles start-up de services ne se posent plus la question : elles se lancent en utilisant l'Open Data et les Open API. En témoigne Home'n'go, créée en juillet dernier par trois étudiants de HEC. Ce site révolutionne la recherche de logements. « Nous agrégeons 1,8 million d'annonces immobilières grâce à des partenariats avec des sites comme LeBonCoin, PageJaunes ou AvendreAlouer, confie Adrien Pavillet, cofondateur. Nous augmentons ces annonces avec des données publiques de l'Insee qui donnent le prix au mètre carré dans le quartier, la typologie de population (âge, revenu moyen, densité, catégories socioprofessionnelles), la présence de bureaux de poste... » La start-up cherche à préciser le taux de réussite au bac du lycée du coin, la présence de supermarchés, de pharmacies, etc. À partir de là, les internautes bénéficient d'un espace collaboratif sécurisé pour partager les annonces et les démarches à accomplir.

Réagir

Commentaires

Approximation  a écrit le 11/02/2013 à 10:28 :

Factual n'a pas mis la clef sous la porte, comme mentionné dans cet article et semble très bien se porter: www.factual.com

Journaliste, pensez à vérifier vos sources avant d'écrire des bétises

Mehdi  a écrit le 10/02/2013 à 3:18 :

L'étude "Six Reasons Why APIs Are Reshaping Your Business, de FaberNovel" a été faite par Fabernovel et aussi Webshell , dans le cadre des APIdays, le 1 er évènement international dédié aux APIs organisé également par Webshell et Fabernovel.

Mehdi COO de Webshell ;)

Mehdi  a écrit le 10/02/2013 à 3:15 :

Petite correction : dans l'article il est dit qu'en "l'an 2000 il y avait 2000 APIs".
C'est en 2008 qu 'on comptait 2000 APIs.
En l'an 2000 il n' y avait qu' Ebay qui avait une API, suivi par Amazon en 2002 puis Salesforce puis des milliers d'autres depuis....

desspe  a écrit le 09/02/2013 à 11:50 :

Heuu.. c'est moi où la deuxième partie de l'article est un ramassi de buzzwords collés les uns à la suite des autres? Même la mise en page ne suit pas avec plein de fautes de ponctuation!