Big data : attention à la privatisation des données

 |   |  956  mots
(Crédits : Reuters)
Le débat sur l'utilisation des données numériques donne lieu à beaucoup de fantasmes, autour de l'espionnage des individus. En fait, le vrai problème est celui de la privatisation de ces données par quelques géants du web. Il faudrait aller vers un "open data" des données privées. Par Hervé Mignot, associé du cabinet Equancy, docteur ès Sciences, enseignant à Sciences Po-Paris

Aujourd'hui la place centrale occupée par la thématique du Big Data relève plus souvent du mythe que de la réalité. Il ne s'agit pas en effet d'en faire un débat politique centré uniquement sur l'aspect sécuritaire mais au contraire d'appréhender l'ensemble des problématiques soulevées. Les enjeux réels de ce débat dépassent largement l'aspect sécuritaire. Ils résident notamment dans la dimension économique, la dimension de décision publique mais aussi dans la dimension culturelle avec les digital humanities, culturonomics, qui permet d'engager une approche numérique et quantitative des « humanités » et des dynamiques culturelles.

Les géants du Web ne travaillent pas pour le gouvernement américain!

 Certes, l'actualité récente impose de réfléchir sur les capacités de surveillance qu'offre aux états la numérisation de nos vies et leur centralisation dans les serveurs de quelques géants américains du web (Google, Facebook, Apple, etc.). Pour autant, il est important de ne pas confondre cause et conséquence. Les géants du web n'ont pas constitué leurs gisements de données afin de répondre aux injonctions d'espionnage de l'état américain. Ils les constituent car la donnée est devenue un levier stratégique de l'économie qui se dessine dès aujourd'hui pour demain.

 Le développement de modèles prédictifs

Eric Sadin, dans son livre sur la Société de l'Anticipation décrit ainsi cette révolution : « L'objectif ultime visé cherche à produire des résultats prédictifs par des mises en relation dévoilant des situations en formation […] une activité en expansion, celle développant des MODELES PRÉDICTIFS, appelés à moduler de part en part la structure des réseaux, de la vie sociale et d'une économie basée sur la prémonition computérisée des tendances collectives et des aspirations individuelles. »

Des données exploitées à des fins économiques, les individus "anonymisés"

Il est nécessaire de faire de la pédagogie et ainsi expliquer comment ces données sont exploitées mathématiquement tout d'abord à des fins économiques. Au cœur des algorithmes d'extraction de connaissance, les individus ne sont que des numéros anonymes, lien technique entre les informations les concernant.

Très souvent, il est impossible de connaître l'identité réelle des individus, car ces données d'identification personnelle (aux États-Unis, légalement définies comme Personally Identifiable Information) auront été mises à part car inutiles à l'analyse des comportements. Mais encore plus fondamentalement, les sciences de la donnée n'apprennent rien des informations d'un seul individu. Car c'est l'accumulation de comportements qu'une algorithmique statistique contraste les uns aux autres pour apprendre que tel comportement est prédictif de telle tendance ou de telle aspiration. Même l'utilisation marketing faite ensuite de ces modèles prédictifs traite « mécaniquement » nos données sans que ces traces numériques accumulées de nos vies ne fassent l'objet d'espionnage.

 Quel doit être le rôle de l'Etat?

Et vous verrez que bientôt, on s'interrogera plutôt sur la manière dont les entreprises confient leur relation clients à ces traitements algorithmiques « impersonnels » de nos comportements, nous réduisant à des anticipations probabilisées par notre anonymisation dans la masse mathématiquement contrastée des consommateurs… Quel peut être alors le rôle de l'État dans l'accompagnement de cette révolution des données ? Selon nous, il doit agir sur deux axes.

 Éviter la privatisation au profit des géants du Web: pour une Open Data des données privées

Premièrement en s'assurant que nos données, et par extension l'Internet, ne soient pas privatisées au profit de quelques géants du web. Ceux-ci mettent en place des stratégies de verrouillage au sein de leurs services, créant des continents numériques privatisés, allant à l'encontre de l'idée même d'Internet. L'ouverture des données comportementales collectées par ces entreprises doit être assurée par un dispositif législatif si nécessaire.

Il s'agit d'aller au-delà du simple droit de consultation et de rectification donné par la loi française par exemple, mais d'imposer la mise en place de dispositifs techniques d'accès (des interfaces programmatiques ou API) permettant à des programmes tiers, autorisés préalablement, à accéder à ces données.

Leur exploitation serait ainsi délégué à d'autres innovateurs que ceux qui les collectent, et éviterait un « enfermement » numérique, sans pour autant priver l'entreprise qui collecte les données des revenus qu'elle peut en tirer pour assurer les services utilisés. Une sorte Open Data des données privées. Déjà certaines entreprises se sont engagées dans cette voie génératrice d'innovations.

 La France a un terreau favorable

Deuxièmement, en favorisant une explosion « cambrienne » de l'économie numérique : les évolutions sont fulgurantes dans l'écosystème numérique, les positions se perdent aussi vite qu'elles se gagnent. Pour preuve un Microsoft quasiment hors du grand jeu, un Google hégémonique adoptant des techniques de verrouillage, un Facebook en voie de ringardisation et un Apple peut-être à un tournant de déclin… Et la France a quelques champions de cette économie de l'anticipation algorithmique par la donnée et des atouts avec un terreau favorable de filières mathématiques et informatiques.

L'action publique doit impérativement conjuguer deux axes majeurs : la protection des consommateurs par rapport à une privatisation abusive des données par quelques géants du web, non pas en empêchant leur collecte, source d'innovations, mais en l'ouvrant le plus possible, et favoriser le développement d'une économie numérique innovante qui bousculera les positions établies pour faire croitre des champions européens.

 

 

 

Réagir

Votre email ne sera pas affiché publiquement
Tous les champs sont obligatoires

Commentaires
a écrit le 10/01/2014 à 18:11 :
Cet article est intéressant car il se situe au delà du thème fantasmagorique de la surveillance Orwellienne généralisée, largement et complaisamment relayé par de nombreux média. S'il ne fait effectivement aucun doute que les technologies associées au "Big Data" peuvent être utilisées dans un contexte de surveillance (légale ou non), c'est avant tout dans le développement de modèles mathématiques et l'exploitation statistique des informations extraites que se situent les véritables enjeux économiques.

En marge du "coeur de métier" consistant à exploiter ces données de façon optimale, la question de leur privatisation est effectivement essentielle; l'exemple qui vient immédiatement à l'esprit est celui des réseaux sociaux type Facebook ou Google Plus, qui imposent à leur utilisateurs de renoncer à la propriété des informations (textes, photos, etc...) qu'ils publient sur ces réseaux.

Il convient d'ailleurs de noter à ce sujet que les données "brutes" ont relativement peu de valeur en elles mêmes; pour pouvoir exploiter économiquement ces données, on fait généralement intervenir des techniques de corrélation plus ou moins sophistiquées. De nouvelles données composites sont ainsi produites à partir d'informations élémentaires.

Or, on ne peut nier que cette activité entraine un coût pour les entreprises concernées (R&D, exploitation, etc...). La question est alors de savoir à partir de quel moment il devient socialement acceptable que le produit de ce travail de corrélation de données, fussent-elles publiques et individuelles, devient assez conséquent pour être considéré comme la propriété de l'entreprise.
a écrit le 10/01/2014 à 0:51 :
Hélas, l’idée d'imposer aux entreprises de partager leurs données a travers des API (en réalité ce sont des logiciels qui fournissent les données) est naïve : on peut forcer une entreprise de mettre en place un logiciel, mais pas de déboguer ce logiciel pour qu'il marche bien :-)
Imaginez le malheur de fournir a vos concurrent des données corrompues :-)
Réponse de le 23/04/2014 à 7:29 :
La construction d'une API est pour beaucoup d'entreprises qui démarrent la bonne façon de concevoir leur système d'information pour pouvoir s'adapter facilement aux évolutions de l'entreprise, à la mobilité, etc. Imaginer qu'un volet de ces APIs soit dédié à l'accès à ses données personnelles (des standards comme OAuth sont bien dédiés à l'authentification) ne me semble pas déraisonnable.
Réponse de le 23/04/2014 à 7:29 :
La construction d'une API est pour beaucoup d'entreprises qui démarrent la bonne façon de concevoir leur système d'information pour pouvoir s'adapter facilement aux évolutions de l'entreprise, à la mobilité, etc. Imaginer qu'un volet de ces APIs soit dédié à l'accès à ses données personnelles (des standards comme OAuth sont bien dédiés à l'authentification) ne me semble pas déraisonnable.
a écrit le 09/01/2014 à 15:07 :
Le fait de compiler des ficheirs est un dnager en soi-même. Mignot nous dit que c'est pour notre bien, on s'en doute :-) Les gouvernements et autres gens mal intentionnés n'ont pas accès à nos données, on s'en doute aussi :-) Et on ne sait pas non plus que par le passé, ces données ont été utilisées contre nous. Berf, il ne reste plus que "ceux qui n'ont rien à se reprocher" pour croire à toutes ces balivernes. Comment s'appelera le nouvel organisme de centralisation des données, la Stasi, le KGB ou la NSA, on ne sait pas et on ne nous le dira pas :-)
a écrit le 09/01/2014 à 14:15 :
"Les géants du Web ne travaillent pas pour le gouvernement américain!"
pour écrire ça faut être...très bien informé, tellement bien qu'il faudrait travailler à la NSA pour vraiment savoir...c'est n'est pas votre cas il semble.
Alors comment être affirmatif à ce point? Sachant qu'affirmer le contraire n'est pas non plus possible.

bref, vous êtes bien de votre époque.
a écrit le 09/01/2014 à 12:44 :
L'idée est séduisante mais ne craignez-vous pas que ces données ouvertes ne soient un excellent moyen pour les entreprises d'espionner leurs concurrents ?
Réponse de le 23/04/2014 à 7:32 :
L'ouverture est celle que je demande à l'entreprise qui exploite mes données personnelles. Libre à moi ensuite de les "confier" à un concurrent. Généralement, un concurrent développera un service similaire à celui dont je souhaite récupérer les informations. Il ne sera pas forcément le plus à même d'exploiter facilement ces données. C'est plutôt l'écosystème autour de cette API qui me semble intéressant de développer, dans la réutilisation, en évitant le lock-in, etc.
a écrit le 09/01/2014 à 12:27 :
sur le net, des l'instant on écrit quelque chose, vous n'êtes plus anonyme, cela devient
publique. il est facile de vous retrouver, si on le décide et de tout savoir sur vous. quand au cryptage, ce n'est pas un problème pour les gouvernements.

Merci pour votre commentaire. Il sera visible prochainement sous réserve de validation.

 a le à :