Le business contrarié des données de santé

Les start-up françaises ont du mal à accéder aux bases de données de santé pour développer des algorithmes d'aide au diagnostic ou au choix thérapeutique. Le numérique investit les pratiques médicales, mais l'innovation ne se fera pas sans une valorisation des données de l'Assurance maladie et l'organisation de leur mise à disposition des chercheurs du privé. Une pratique qui doit rester encadrée par des règles éthiques.

Florence Pinaud

24 Févr 2015, 7:01

Aux Etats-Unis, plusieurs assureurs ont déjà mis en place des contrats de protection de santé qui permettent, dans le meilleur des cas, de réduire leur coût en tenant compte des données transmises par les assurés porteurs d'objets connectés.

Le 26 janvier, l'Assurance maladie a cédé pour la première fois à la pression du mouvement favorable à l'ouverture des données en matière de santé. Avec la mission Etalab (Etalab. gouv.fr), la Cnam a organisé son premier « hackathon » en réunissant une soixantaine de participants d'horizons différents autour d'un jeu de données de remboursement d'actes médicaux. Un premier événement remarqué et très commenté tant il est difficile en France d'accéder aux données de santé. Dans leur mouvement de contestation du projet de loi santé de Marisol Touraine (voir ci-dessous), les médecins refusent la généralisation du tiers payant, mais aussi l'ouverture de l'accès aux précieuses données sur la santé de leurs patients. Au centre de beaucoup de polémiques et d'interprétations contrastées, l'article 47 de ce projet de loi prévoit la création d'une grande base de données de santé à laquelle pourraient avoir accès non plus seulement les laboratoires publics mais aussi les chercheurs du privé. Une ouverture qui améliorerait l'analyse de ces données pour optimiser le traitement et la prévention des maladies, avec des innovations comme les nouveaux logiciels d'aide au diagnostic ou de suivi des épidémies. De nombreuses start-up françaises sont dans les starting-blocks.

Après les scandales successifs des prothèses mammaires PIP et du Médiator, les Français demandent plus de transparence sur l'univers médical. Selon ses partisans, l'ouverture des données de santé de la Sécurité sociale aurait permis de faire des corrélations entre le coupe-faim Médiator et l'apparition de certains problèmes cardiaques avant que les lanceurs d'alerte finissent par se faire entendre.

Pour le cabinet McKinsey, cette ouverture donnerait aussi la possibilité de choisir son praticien ou son hôpital sur la base de critères objectifs.

« En Allemagne, le site Internet de l'AOK, le premier régime d'assurance maladie, permet de comparer les hôpitaux en fonction de critères objectifs, observe Thomas London, directeur associé en charge du pôle santé chez McKinsey. Cette transparence aide à la prise de décision des patients. Et puis en comparant la qualité, la sécurité, les tarifs ou encore la performance opérationnelle des médecins et des établissements, on introduit une notion d'émulation entre établissements, fondée sur des critères de résultats. Une concurrence qui peut tirer la qualité vers le haut. »

Des milliards de données pour chaque patient

Inéluctablement, les données s'imposent dans l'univers médical, entre le stéthoscope et le bloc d'ordonnances. Car les dernières découvertes conduisent à une connaissance de plus en plus fine et complexe du corps humain. Avec des techniques d'imagerie sophistiquées et des séquençages ADN réunissant des milliards de paramètres, les données se mesureront bientôt en exaoctets, c'est-à-dire en milliards de gigaoctets (Go). Une dimension qui les fait actuellement passer dans la catégorie des mégadonnées (big data). Sur le sujet, le cofondateur de Doctissimo et président de DNAVision (actionnaire minoritaire de La Tribune), Laurent Alexandre, est formel : d'ici à 2035, les dossiers médicaux des patients contiendront des milliards de données.

« Les quatre axes de développement du big data en santé sont les objets connectés, la génomique, l'imagerie du cerveau et les nanotechnologies, observe-t-il. Avec ces technologies, le nombre de données par patient est en train d'exploser et cela aura forcément des conséquences sur la pratique médicale. »

Selon ce promoteur de la génomique, les diagnostics et les prises de décision thérapeutiques vont être de plus en plus souvent effectués par des systèmes informatiques experts, seuls capables de gérer autant de données.

Pour comprendre et pratiquer cette future médecine très personnalisée, les médecins vont avoir tout intérêt à participer à son développement. Car dans le cas contraire, ils risquent de voir leur rôle considérablement amoindri, au profit de ceux qui maîtrisent les algorithmes d'analyse et de traitement des données, biologiques comme génétiques. Afin de négocier la mutation en cours, ils devront appréhender de nouveaux outils tels que l'exploration de données (data mining) qui permet d'extraire des corrélations dans des océans de données, ou les algorithmes capables d'élaborer des modèles médicaux en fonction des objectifs fixés. Les outils mathématiques de la médecine de demain seront ainsi élaborés à des fins de surveillance, d'analyse mais aussi - et de plus en plus - à des fins de prédiction et de prescription.

De la science-fiction ? Non. En matière de santé, les premières applications issues de mégadonnées sont déjà entrées en phase de test. Avec 21.000 gènes dans l'ADN humain pour 20.000 gigaoctets (Go) de données, impossible d'analyser l'ensemble d'un séquençage sans faire appel à un système expert. Aujourd'hui, la puissance des super-calculateurs tente de déterminer l'efficacité des traitements en fonction des tumeurs cancéreuses et de l'ADN des patients : en analysant des milliards de résultats, on peut finir par comprendre quelle formule correspondra le mieux à quel profil. D'autres compulsent non pas seulement des données, mais l'ensemble des études scientifiques menées sur une maladie. C'est ce que fait déjà Watson, le superordinateur d'IBM qui, après avoir remporté le jeu télévisé américain « Jeopardy ! », est devenu un spécialiste du conseil thérapeutique pour les cas de cancer du poumon.

Comme Big Blue, la plupart des grands noms de la technologie se sont lancés sur le marché de la santé. Le plus influent investisseur en capital-risque de New York, Fred Wilson, l'a bien expliqué lors de la manifestation Le Web, en décembre dernier à Paris : dans le numérique, la santé est LE terrain à investir en priorité. Car dans ce domaine, les motivations des consommateurs comme leurs attentes sont très fortes.

Déjà, Intel collabore avec la Fondation Michael J. Fox afin d'utiliser les données des objets connectés pour lutter contre la maladie de Parkinson. En France, le Centre d'acquisition et de traitement d'images pour la maladie d'Alzheimer (Cati) et le Commissariat à l'énergie atomique (CEA) participent à la création d'un superordinateur - le « Human Brain Project » - capable de simuler le cerveau, d'ici à 2023. En combinant les données, les chercheurs espèrent modéliser l'évolution de la maladie, afin de la diagnostiquer de façon très précoce, pour en ralentir ou même en arrêter les effets.

Selon les promoteurs de la médecine des données, ces pratiques vont générer des économies. Pour Régis Sénégou, président de la Fédération des entreprises des systèmes d'information sanitaires et sociaux LESSIS, « l'utilisation intelligente de la base de données de l'Assurance maladie pourrait repérer quels sont les doublons de consultations et de soins pour optimiser les dépenses de santé et limiter les accidents liés aux mauvaises associations de médicaments. »

Dans le concert mondial, la France ne manque pas d'atouts et de talents, même si elle reste bien loin des géants américains.

Comme l'explique Charles Huot, directeur général délégué de l'entreprise informatique Temis et président du comité éditorial de l'alliance Big Data, « notre pays a tous les atouts médicaux, mathématiques et linguistiques pour réussir, mais il faut laisser les porteurs de projet avoir accès aux données anonymes. Il serait dommage que les informations utilisées par nos startup proviennent non pas des données publiques, mais uniquement de celles qui circulent sur les réseaux sociaux et les forums. Cela décrédibiliserait notre politique de santé ».

Le difficile accès aux données en France

De fait, pour les start-up françaises, l'accès à des données est rarement simple. Basée à Paris, CardioLogs a été créée en avril 2014, lorsqu'elle a gagné le concours mondial de l'Innovation. Cette start-up compte six collaborateurs et développe un algorithme capable de diagnostiquer des troubles cardiaques en analysant un simple électrocardiogramme (ECG). L'algorithme est mis au point avec une technique de machine learning

assistée par un cardiologue, qui apprend au logiciel à associer les signaux et les troubles cardiaques. Crucial pour les services d'urgence ou les Samu. Quand elle a lancé son projet, CardioLogs était en panne de données. « Nous avons dû faire appel à des bases de données américaines et russes très utilisées par les chercheurs, précise son président Yann Fleureau. En France, il est compliqué de récupérer des données, même parfaitement anonymes, car les acteurs qui les détiennent n'ont pas très envie de les partager. Par la suite, les constructeurs d'appareils ECG avec lesquels nous avons noué des partenariats nous ont donné accès à leurs propres bases. »

Il est vrai qu'en France, les données de santé sont qualifiées de « sensibles », au même titre que les données d'orientations sexuelles, de croyances religieuses et d'opinions politiques.

« Elles concernent ce qu'il y a de plus privé : le corps et la vie des personnes, insiste Sophie Nerbonne, directrice de la conformité à la Commission nationale de l'informatique et des libertés (Cnil). La connaissance de l'état de santé peut impliquer des conséquences en termes de facilité à trouver un emploi, à obtenir un prêt bancaire ou à négocier un contrat d'assurance. Et ce caractère sensible est renforcé par le secret médical. » Aujourd'hui, la plupart des projets de santé en mode données nécessitent un volet éthique, et certains cabinets d'avocats se spécialisent sur le sujet. Notre pays possède un autre atout dans la course aux données : son centralisme. Il nous permet de détenir une très grande base de données de santé : le Système national d'information interrégimes de l'Assurance maladie (SNIIRAM) qui réunit tous les actes médicaux et les séjours hospitaliers d'un patient (voir infographie). Mais ces données ne sont pas facilement disponibles. Celles qui sont totalement anonymes et épurées de nombreuses indications parfois nécessaires à une bonne analyse (on les dit alors agrégées) sont généralement accessibles en données ouvertes. Les données nominatives, mais aussi celles qui sont consignées sous un numéro pseudonyme « risquant » d'être identifiées par un travail de recoupement font l'objet de procédures d'autorisation relativement longues et complexes dont se plaignent la plupart des chercheurs et les rares organismes autorisés à les solliciter.

Toutefois, sous l'impulsion de ces start-up et face aux développements des activités santé des Gafa (Google, Apple, Facebook, Amazon), la mobilisation paraît être décrétée. Au premier semestre, le projet de loi de la secrétaire d'État chargée du Numérique, Axelle Lemaire, encouragera l'économie des données avec un élargissement de l'ouverture des données publiques et cinq pôles de compétitivité numériques. Les trois présents en région Île-de-France - Cap Digital, Systematic et Medicen - viennent de s'associer au sein d'une commission « TIC et santé » présidée par Jean-Marc Bourez de Sanofi. De son côté, Orange est en train de réunir plusieurs partenaires autour d'un groupe de réflexion « Healthcare Data Institute » avec le CEA, le spécialiste de l'hospitalisation privée Vitalia, le cabinet McKinsey, le cabinet d'avocats Desmarais...

Corrélation n'est pas causalité

Pour le directeur d'Orange Healthcare, Thierry Zylberberg, l'utilisation des mégadonnées en santé est une pratique plus complexe qu'il n'y paraît :

« Si l'on imagine qu'il suffit de mettre toutes les données ensemble et de les mouliner avec des ordinateurs superpuissants pour voir ce qu'il en sort, c'est une vision bien naïve. Nous savons bien que la médecine de demain ne se bornera plus au seul rapport entre le médecin et son patient. Mais les Gafa ne sont pas non plus les principaux acteurs de l'avenir médical. Cet avenir se trouve sans doute entre ces deux visions et doit savoir prendre en compte les spécificités du système de santé d'un pays avec ses professionnels, ses procédures, ses organismes payeurs, etc. »

Si Orange n'est pas en avance sur les méga-données de santé, l'opérateur estime que le sujet nécessite une vision transversale pour porter ses fruits. De fait, dans ce domaine, la promesse prend parfois des allures de mirage, car toute donnée doit être certifiée pour produire un modèle fiable. « Les méga-données issues des empreintes numériques laissées par les internautes sur les forums ou les moteurs de recherche n'ont d'autre intérêt scientifique que pour des études comportementales ou psychologiques », estime Jean-François Thébaut membre du collège, président de la commission parcours et pratique à la Haute autorité de santé (HAS).

Comme le souligne Norbert Paquel, délégué général d'Edisanté :

« L'analyse des big data laisse certes apparaître des signaux faibles et des corrélations, mais celles-ci ne signifient pas forcément des causes. Ainsi, le lien statistique entre les divorces et les logements avec ascenseurs existe, mais parce qu'il y a un facteur commun, qui est de vivre dans une grande ville. Une fois identifiée une relation, il faut lancer une démarche de recherche pour comprendre les vrais rapports de cause à effet. »

Mise au point pour suivre la progression du virus H1N1 en pleine pandémie de grippe aviaire (2009), l'application Google Flutrends a ainsi récemment montré ses limites. Elle a prédit une fausse épidémie de grippe saisonnière parce que beaucoup d'internautes entraient le mot « grippe » dans le moteur de recherche. Car dans le cas présent l'explosion du nombre de recherches sur la grippe traduisait une simple inquiétude à l'approche de l'hiver, pas une épidémie.

Pour les défenseurs de la protection des données de santé, leur multiplication provoque différent risques. Primo, des données nominatives, mal sécurisées dans les autoévaluations (quantified self) et les applications santé, pourraient être interceptées par des officines mal intentionnées. Et pas seulement. Récemment, une erreur a mené des centaines de dossiers de patients de l'hôpital Nord de Marseille à se retrouver en accès libre sur Internet.

Secundo, certains affirment qu'il est possible de réidentifier des données même sans l'identité des patients, en croisant différentes bases de données dans l'objectif de récupérer le dossier médical d'une personne.

Mais, tertio, l'industrie de santé court aussi un risque majeur. Les algorithmes des Gafa posent la question de leur modalité de restitution. « Si ce sont des algorithmes qui préconisent les traitements à prendre suivant le profil du patient, on peut s'interroger sur leur positionnement vis-à-vis des professionnels de santé et sur les changements des règles du jeu, observe Patrick Biecheler, associé chargé du pôle industrie pharmaceutique & santé du cabinet Roland Berger. Mais aussi sur le rôle laissé aux laboratoires dans l'information sur les traitements médicaux. » Autrement dit, les Gafa ne risquent-ils pas de monnayer un jour le rang des molécules à prescrire qui apparaîtront dans leurs logiciels ?

Le risque d'algorithmes manipulés-manipulateurs

Enfin, le modèle big data pose aussi la question du risque de normalisation des comportements sous l'impulsion des programmes de prévention. Le fait de penser que la technologie peut résoudre tous les problèmes de l'humanité, pour peu que l'on accepte ses modèles mathématiques, fait un peu froid dans le dos. « Un des projets de Google est d'établir le profil moléculaire standard d'un individu en bonne santé, rappelle Arnaud Laferté, project manager au sein du pôle industrie pharmaceutique & santé du cabinet Roland Berger. Par essence, ce profil sert de base à un étalonnage de la santé, il est impératif pour les utilisateurs d'en garantir l'usage éthique. »

Pour certains assureurs, cette base pourrait-elle servir à moduler les primes ? Pour l'heure, ce n'est qu'un scénario de science-fiction, bien sûr... bien que déjà, Axa incite ses assurés à faire du sport dans le cadre de son nouveau contrat santé e-Modulango. Les mille premiers clients ont reçu en cadeau un bracelet Pulse, tracker d'activité. Ceux qui ont accepté de participer au concours des « 10.000 pas » ont transmis leurs relevés d'activité à la start-up française Withings, qui a ensuite communiqué à Axa les noms des assurés ayant suffisamment marché pour gagner des chèques cadeaux.

Aux États-Unis, plusieurs assureurs ont déjà mis en place ce type de contrat via les entreprises. Par exemple, BP propose des bracelets connectés Fitbit à ses salariés et ceux qui font de l'exercice peuvent réduire le coût de leur mutuelle. Aujourd'hui, cette surveillance se contente d'encourager les gens à bouger. Mais jusqu'à quand ? À quand, par exemple, l'obligation du quart d'heure de sport quotidien et la pizza ou la bière uniquement délivrées sur ordonnance dans le cadre de la lutte contre le surpoids ? Sans compter qu'avec cette modélisation toujours plus poussée de l'organisme humain en algorithmes mathématiques, on peut se demander si Google ou Amazon sauront un jour prévoir l'année ou le mois de la mort d'une personne en fonction de ses données de santé...

Sujets les + lus

Sujets les + commentés

Sénégal : le nouveau président veut renégocier les contrats miniers et pétroliers, accusés de léser le pays

Rheinmetall, le géant allemand de l’armement, va ouvrir une usine d’obus de calibre 155 mm en Lituanie

Les profits du colossal fonds souverain de la Norvège bondissent : plus d'un milliard d’euros par jour depuis janvier

Plan d'urbanisme à Paris : les professionnels dénoncent « une aberration », le premier adjoint d'Hidalgo leur répond

L'attaque israélienne contre l'Iran a été menée par de petits drones, possiblement lancés depuis le territoire iranien

Commentaire 1

algorithmes à écrit le 24/02/2015 à 13:43

Signaler

Vous avez dit algorithmes. Vérifier bien vos remboursements de sécurité sociale, afin de vous assurer que la sécurité sociale justement ne vous ponctionne pas 0,50 centimes d'euros sur vos boîtes de médicaments non remboursés, que le pharmacien aurai...

Merci pour votre commentaire. Il sera visible prochainement sous réserve de validation.

Electronique

Le business contrarié des données de santé

Des milliards de données pour chaque patient

Le difficile accès aux données en France

Corrélation n'est pas causalité

Le risque d'algorithmes manipulés-manipulateurs

Newsletter - Tech & Médias