Big data : attention à la privatisation des données

Par Hervé Mignot  |   |  956  mots
Le débat sur l'utilisation des données numériques donne lieu à beaucoup de fantasmes, autour de l'espionnage des individus. En fait, le vrai problème est celui de la privatisation de ces données par quelques géants du web. Il faudrait aller vers un "open data" des données privées. Par Hervé Mignot, associé du cabinet Equancy, docteur ès Sciences, enseignant à Sciences Po-Paris

Aujourd'hui la place centrale occupée par la thématique du Big Data relève plus souvent du mythe que de la réalité. Il ne s'agit pas en effet d'en faire un débat politique centré uniquement sur l'aspect sécuritaire mais au contraire d'appréhender l'ensemble des problématiques soulevées. Les enjeux réels de ce débat dépassent largement l'aspect sécuritaire. Ils résident notamment dans la dimension économique, la dimension de décision publique mais aussi dans la dimension culturelle avec les digital humanities, culturonomics, qui permet d'engager une approche numérique et quantitative des « humanités » et des dynamiques culturelles.

Les géants du Web ne travaillent pas pour le gouvernement américain!

 Certes, l'actualité récente impose de réfléchir sur les capacités de surveillance qu'offre aux états la numérisation de nos vies et leur centralisation dans les serveurs de quelques géants américains du web (Google, Facebook, Apple, etc.). Pour autant, il est important de ne pas confondre cause et conséquence. Les géants du web n'ont pas constitué leurs gisements de données afin de répondre aux injonctions d'espionnage de l'état américain. Ils les constituent car la donnée est devenue un levier stratégique de l'économie qui se dessine dès aujourd'hui pour demain.

 Le développement de modèles prédictifs

Eric Sadin, dans son livre sur la Société de l'Anticipation décrit ainsi cette révolution : « L'objectif ultime visé cherche à produire des résultats prédictifs par des mises en relation dévoilant des situations en formation […] une activité en expansion, celle développant des MODELES PRÉDICTIFS, appelés à moduler de part en part la structure des réseaux, de la vie sociale et d'une économie basée sur la prémonition computérisée des tendances collectives et des aspirations individuelles. »

Des données exploitées à des fins économiques, les individus "anonymisés"

Il est nécessaire de faire de la pédagogie et ainsi expliquer comment ces données sont exploitées mathématiquement tout d'abord à des fins économiques. Au cœur des algorithmes d'extraction de connaissance, les individus ne sont que des numéros anonymes, lien technique entre les informations les concernant.

Très souvent, il est impossible de connaître l'identité réelle des individus, car ces données d'identification personnelle (aux États-Unis, légalement définies comme Personally Identifiable Information) auront été mises à part car inutiles à l'analyse des comportements. Mais encore plus fondamentalement, les sciences de la donnée n'apprennent rien des informations d'un seul individu. Car c'est l'accumulation de comportements qu'une algorithmique statistique contraste les uns aux autres pour apprendre que tel comportement est prédictif de telle tendance ou de telle aspiration. Même l'utilisation marketing faite ensuite de ces modèles prédictifs traite « mécaniquement » nos données sans que ces traces numériques accumulées de nos vies ne fassent l'objet d'espionnage.

 Quel doit être le rôle de l'Etat?

Et vous verrez que bientôt, on s'interrogera plutôt sur la manière dont les entreprises confient leur relation clients à ces traitements algorithmiques « impersonnels » de nos comportements, nous réduisant à des anticipations probabilisées par notre anonymisation dans la masse mathématiquement contrastée des consommateurs… Quel peut être alors le rôle de l'État dans l'accompagnement de cette révolution des données ? Selon nous, il doit agir sur deux axes.

 Éviter la privatisation au profit des géants du Web: pour une Open Data des données privées

Premièrement en s'assurant que nos données, et par extension l'Internet, ne soient pas privatisées au profit de quelques géants du web. Ceux-ci mettent en place des stratégies de verrouillage au sein de leurs services, créant des continents numériques privatisés, allant à l'encontre de l'idée même d'Internet. L'ouverture des données comportementales collectées par ces entreprises doit être assurée par un dispositif législatif si nécessaire.

Il s'agit d'aller au-delà du simple droit de consultation et de rectification donné par la loi française par exemple, mais d'imposer la mise en place de dispositifs techniques d'accès (des interfaces programmatiques ou API) permettant à des programmes tiers, autorisés préalablement, à accéder à ces données.

Leur exploitation serait ainsi délégué à d'autres innovateurs que ceux qui les collectent, et éviterait un « enfermement » numérique, sans pour autant priver l'entreprise qui collecte les données des revenus qu'elle peut en tirer pour assurer les services utilisés. Une sorte Open Data des données privées. Déjà certaines entreprises se sont engagées dans cette voie génératrice d'innovations.

 La France a un terreau favorable

Deuxièmement, en favorisant une explosion « cambrienne » de l'économie numérique : les évolutions sont fulgurantes dans l'écosystème numérique, les positions se perdent aussi vite qu'elles se gagnent. Pour preuve un Microsoft quasiment hors du grand jeu, un Google hégémonique adoptant des techniques de verrouillage, un Facebook en voie de ringardisation et un Apple peut-être à un tournant de déclin… Et la France a quelques champions de cette économie de l'anticipation algorithmique par la donnée et des atouts avec un terreau favorable de filières mathématiques et informatiques.

L'action publique doit impérativement conjuguer deux axes majeurs : la protection des consommateurs par rapport à une privatisation abusive des données par quelques géants du web, non pas en empêchant leur collecte, source d'innovations, mais en l'ouvrant le plus possible, et favoriser le développement d'une économie numérique innovante qui bousculera les positions établies pour faire croitre des champions européens.