Quelles pistes pour lutter efficacement contre les biais des algorithmes ?

Publié le 11 mars 2020 à 05:23

Ajouter La Tribune à vos sources préférées

Lois, tests en amont, contrôles à posteriori : les idées fusent pour lutter contre les biais des algorithmes. Alors que les Etats-Unis et l'Union européenne se penchent sur de nouvelles législations, l'Institut Montaigne préconise au contraire, dans un rapport, une approche préventive et sectorielle, et l'ouverture -sous conditions- des données sensibles aujourd'hui protégées. Explications.

Les algorithmes sont de plus en plus impliqués dans des décisions qui affectent nos vies. Le parcours post-Bac, l'octroi d'un prêt immobilier, les conditions d'une assurance, ou même, aux Etats-Unis, envoyer quelqu'un en prison ou pas. Derrière ces décisions qui peuvent bouleverser un destin agit la main invisible des algorithmes, ces épouvantails qui ne sont en réalité que des programmes informatiques nourris à partir de données choisies par des humains.

Et de la même manière que les décisions humaines peuvent être influencées par des biais conscients ou inconscients (en fonction du genre, de l'âge, de l'originale sociale ou de l'ethnie...), les mêmes risques s'appliquent, logiquement, à l'intelligence artificielle. Car comme l'explique la mathématicienne Cathy O'Neil, "un algorithme n'est en réalité qu'une opinion intégrée aux programmes". Plusieurs études ces dernières années en ont établi la preuve : aux États-Unis, les Afro-américains sont plus discriminés que les Blancs sur les plateformes de location d'appartements en ligne, et ils vont davantage en prison que les Blancs pour le même délit lorsque la justice s'appuie sur un logiciel de prédiction des récidives. Toujours aux États-Unis, les femmes sont également moins sollicitées que les hommes par les algorithmes qui suggèrent des emplois pour les métiers scientifiques et techniques.

Le "RGPD de l'IA" de l'Europe, une fausse bonne idée ?

Cette prise de conscience que la technologie n'est pas neutre entraîne un défi inédit : il faut maîtriser les biais des algorithmes pour qu'ils puissent être socialement acceptés.

"Le numérique et l'intelligence artificielle ne pourront pas se développer en France s'ils sont porteurs de discriminations massives. Une telle automatisation à grande échelle de décisions inéquitables serait inacceptable pour la société", alerte l'Institut Montaigne, un cercle de réflexion à tendance libérale, dans un rapport publié ce mardi 10 mars sur les biais des algorithmes.

Pour sortir de l'ornière, la machine à idées tourne à plein. L'option législative est le premier réflexe. Aux États-Unis, un projet de loi, le "

Algorithmic Accountability Act of 2019", est en discussions depuis près d'un an. Il vise à forcer l'État et les entreprises de plus de 50 millions de dollars de chiffre d'affaires, sous le contrôle de la Federal Trade Commission (FTC), à soumettre leurs algorithmes à une batterie de contrôles pour déceler d'éventuels biais dans les recommandations. De son côté, l'Union européenne a annoncé en avril 2019 une phase de consultation qui devrait déboucher sur la création d'une directive pour une intelligence artificielle éthique, comme un "RGPD de l'IA". L'objectif : imposer sept principes pour une IA "digne de confiance", parmi lesquels figurent la traçabilité des systèmes d'IA, la diversité, la non-discrimination et l'équité des jeux de données utilisés, et un principe de responsabilisation, c'est-à-dire soumettre les IA à l'obligation de rendre des comptes.

Mais pour l'Institut Montaigne, il est "prématuré à ce stade" et "inadapté" de lancer une directive sur l'IA et l'éthique des algorithmes. "Compte tenu du faible recul dont nous disposons, une loi spécifique aux biais risquerait de bloquer toute innovation sans résoudre le problème de fond", écrit le rapport. D'autant plus que la diversité des usages d'algorithmes (dans la banque, l'assurance, l'automobile, la santé, le recrutement, l'éducation, la justice ou encore la police) nécessite de tenir compte des spécificités sectorielles. "La définition d'un biais et de ce qu'est l'équité sera immanquablement différente selon que l'on discute d'un algorithme de conduite autonome, de mise au point d'un protocole de chimiothérapie ou de ciblage publicitaire", argumente l'institut. Par ailleurs, les algorithmes n'évoluent pas dans un far-west législatif. "La loi Informatique et Libertés, la loi pour une République numérique de 2016 et le RGPD fournissent déjà un cadre légal, certes incomplet mais existant" rappelle Marie-Laure Denis, la présidente de la Cnil.

Faire passer aux algorithmes des "essais cliniques" comme ceux des médicaments

Si tout le monde s'accorde sur la nécessité d'aboutir à une intelligence artificielle explicable, ce vœu pieu se heurte à la réalité. "Bien que désirable, l'explicabilité des algorithmes est techniquement difficile à obtenir tant elle est contraire au principe même de l'apprentissage machine, ce qui créerait un problème de performance des IA", souligne le rapport. Qui poursuit : "Qui cherche à savoir comment fonctionne un avion ? Nous sommes bien plus rassurés par le fait de savoir qu'il a passé les tests de sécurité". Pour Marie-Laure Denis, l'enjeu est plutôt de garantir le fonctionnement équitable de l'algorithme. "Le code de Parcours Sup est ouvert et c'est très bien, mais personne n'y comprend rien. Il faut plutôt savoir expliquer quelles données ont été utilisées et garantir l'absence de biais", ajoute-t-elle.

Newsletter

Tech & IA

Chaque jour à 13h, l’essentiel de l’actualité tech.

Pour cela, l'Institut Montaigne préconise de faire subir aux algorithmes l'équivalent des essais cliniques pour les médicaments. L'idée est de les tester pour s'assurer à la fois qu'ils remplissent bien leur mission initiale, et aussi qu'ils ne sont pas soumis à des biais. Un peu comme les essais cliniques vérifient que le médicament est efficace et qu'il n'entraîne pas d'effets secondaires indésirables. Les tests seraient réalisés autant que possible par les entités -publiques ou privées- qui déploient les algorithmes. Ces entreprises ou administrations devraient au préalable définir, en fonction des secteurs d'activités, ce qu'elles considèrent comme équitable.

"Certains biais sont volontaires, acceptables et sont le fruit de stratégies commerciales [comme l'exigence de parité dans le recrutement, Ndlr], d'autres non. C'est donc in fine à l'entreprise ou à l'administration de se positionner sur ce qu'elle considère comme la bonne définition d'un algorithme équitable, et d'en porter ensuite le risque juridique et réputationnel", milite le rapport.

L'approche de l'Institut Montaigne préconise donc la prévention et la sensibilisation plutôt que la régulation et la sanction. C'est pourquoi le rapport insiste sur la nécessité d'assurer la diversité des équipes qui conçoivent et diffusent les algorithmes, en intégrant, en plus des experts techniques, des personnes de genre, d'âge, de compétences, d'origine sociale et culturelle différents. La formation des techniciens et ingénieurs et la sensibilisation du grand public aux risques de biais dans les algorithmes paraissent aussi crucial.

"En France, la plupart des développeurs ont été formés aux mathématiques appliquées, aux statistiques et à l'informatique, sans formation spécialisée en sciences sociales. On leur apprend à comprendre les défis techniques de la conception et de l'optimisation des algorithmes et non les défis sociétaux", regrette le rapport.

En finir avec le tabou des données sensibles ?

Enfin, comment tester les présence de biais dans les algorithmes si les statistiques ethniques ne sont pas disponibles, et si les données relatives aux 25 critères reconnus de discrimination sont, d'après le rapport, "extrêmement difficiles à collecter" ? L'une des propositions phares du rapport est donc la notion "d'équité active". Autrement dit : en finir avec l'approche universaliste de la France qui consiste vouloir effacer les différences, pour adopter une approche davantage anglo-saxonne ou allemande.

"Nous recommandons d'abandonner l'approche d'équité par ignorance et d'adopter une stratégie d'équité active. Il s'agit d'accepter de mesurer les discriminations, de tester la présence de biais, grâce à la collecte d'information sur les 25 critères protégés. C'est l'indépendance du résultat par rapport à des variables protégées qui garantit un algorithme équitable", affirme le rapport, tout en insistant sur la nécessité d'un encadrement "strict" sur l'usage de ces données (collecte sur un échantillon restreint et finalité de test uniquement). Cette proposition rencontre un franc succès auprès des acteurs de l'IA. En partie parce que le fait d'interdire ou de limiter l'exploitation de données sensibles n'empêche pas les algorithmes de discriminer. Un algorithme publicitaire, par exemple, peut deviner avec une très faible marge d'erreur si telle personne est blanche, noire, homosexuelle, à fort pouvoir d'achat ou handicapée, en exploitant une multitude d'autres données comme les pages web visitées.

SpaceX : comment la coqueluche des marchés a perdu 900 milliards de dollars de valorisation en moins d'un mois

Introduite en Bourse il y a deux semaines, l'action SpaceX a déjà perdu près de 900 milliards de dollars de valeur depuis son pic. En cause, des dépenses colossales dans l'intelligence artificielle, des pertes qui s'accumulent et des investisseurs qui doutent désormais d'une valorisation jugée excessive.

Tech & IA

Le dévéloppement de GTA VI aurait coûté d'après les analystes entre 1 et 2 milliards de dollars.

GTA VI : un blockbuster sans disque qui enterre trente ans de culture de coffret iconique

Une boite pour le jeu vidéo le plus attendu de l'année, Grand Theft Auto VI, sera potentiellement en vente en novembre, mais elle sera vide de tout disque. En supprimant le circuit physique, Rockstar élimine une part du prix absorbé par les intermédiaires et oriente l'essentiel des revenus vers les plateformes numériques.

Tech & IA

ChatGPT proposera désormais trois versions différentes de son agent conversationnel pour des usages spécifiques.

OpenAI lance ses nouveaux modèles GPT-5.6, sous tutelle de la Maison Blanche

OpenAI a présenté sa nouvelle famille de modèles GPT-5.6, censé être plus puissante et moins chère que la précédente. Son déploiement est soumis à l'approbation du gouvernement américain, tout comme celui du concurent Anhtropic.

Tech & IA

IA : Washington autorise Anthropic à redéployer Mythos 5 auprès des entreprises américaines stratégiques

Peu après son blocage d'urgence, le modèle d'IA Mythos 5 d'Anthropic pourra de nouveau être utilisé par une poignée de groupes américains Le gouvernement l'avait interdit mi-juin, craignant qu'il ne puisse être détourné à des fins offensives par des acteurs malveillants.

Tech & IA

Mirendil ambitionne d’automatiser la recherche en IA

Remplacer l'ingénieur en IA, le pari vertigineux de Mirendil, nouvelle licorne californienne

Forte d’une levée de fonds de 200 millions de dollars et d'une équipe issue d'Anthropic, Mirendil développe des modèles capables d’automatiser la recherche en IA pour les équipes de recherche des entreprises. Un nouveau signe du succès des « néolabs », cette génération émergente d’entreprises d’IA qui s’attaquent à des problèmes que les éditeurs généralistes ne creusent pas.

Intelligence Artificielle

Course aux puces IA : IBM vise un saut technologique à 0,7 nm

IBM affirme avoir mis au point une nouvelle architecture de semi-conducteurs qui pourrait, à l’horizon de cinq ans, ouvrir la voie à des puces « 0,7 nm » offrant 50 % de puissance en plus.

Tech & IA

L'équipe de la start-up bordelaise Haiku spécialiste de l'IA appliquée aux métiers du droit.

Intelligence artificielle : Haiku se finance pour équiper les avocats et professions juridiques

La start-up bordelaise Haiku, spécialiste de l'intelligence artificielle appliquée au droit, a bouclé un deuxième tour de table de trois millions d’euros. Alors qu’elle revendique 5 000 utilisateurs, elle entend accélérer en France et se déployer en Europe sur le marché ultra-concurrentiel des métiers juridiques.

Tech & IA

Le logiciel repose uniquement sur des solutions développées en interne d’après le fondateur de YesWeHack.

Le normand YesWeHack déploie des agents IA capables de pirater les systèmes pour les protéger

La société normande, connue pour ses programmes de piratage éthique, déploie des agents capables d’attaquer les systèmes informatiques d’une entreprise comme le ferait un hackeur.

Tech & IA

Quelles pistes pour lutter efficacement contre les biais des algorithmes ?

Le "RGPD de l'IA" de l'Europe, une fausse bonne idée ?

Faire passer aux algorithmes des "essais cliniques" comme ceux des médicaments

Tech & IA

En finir avec le tabou des données sensibles ?

Sur le même sujet

SpaceX : comment la coqueluche des marchés a perdu 900 milliards de dollars de valorisation en moins d'un mois

GTA VI : un blockbuster sans disque qui enterre trente ans de culture de coffret iconique

OpenAI lance ses nouveaux modèles GPT-5.6, sous tutelle de la Maison Blanche

IA : Washington autorise Anthropic à redéployer Mythos 5 auprès des entreprises américaines stratégiques

Remplacer l'ingénieur en IA, le pari vertigineux de Mirendil, nouvelle licorne californienne

Course aux puces IA : IBM vise un saut technologique à 0,7 nm

Intelligence artificielle : Haiku se finance pour équiper les avocats et professions juridiques

Le normand YesWeHack déploie des agents IA capables de pirater les systèmes pour les protéger

Le "RGPD de l'IA" de l'Europe, une fausse bonne idée ?

Faire passer aux algorithmes des "essais cliniques" comme ceux des médicaments

Tech & IA

En finir avec le tabou des données sensibles ?

Sur le même sujet

SpaceX : comment la coqueluche des marchés a perdu 900 milliards de dollars de valorisation en moins d'un mois

GTA VI : un blockbuster sans disque qui enterre trente ans de culture de coffret iconique

OpenAI lance ses nouveaux modèles GPT-5.6, sous tutelle de la Maison Blanche

IA : Washington autorise Anthropic à redéployer Mythos 5 auprès des entreprises américaines stratégiques

Remplacer l'ingénieur en IA, le pari vertigineux de Mirendil, nouvelle licorne californienne

Course aux puces IA : IBM vise un saut technologique à 0,7 nm

Intelligence artificielle : Haiku se finance pour équiper les avocats et professions juridiques

Le normand YesWeHack déploie des agents IA capables de pirater les systèmes pour les protéger