Qui est Scale AI, la startup qui fait le sale boulot des stars de l’IA, accusée d'« esclavage moderne »

La société qui filtre et produit des données pour les fleurons de l’intelligence artificielle (OpenAI, Meta, Microsoft) vient de lever la somme astronomique d’un milliard de dollars. Cependant, les conditions de travail des indépendants connectés à sa plateforme Remotetasks sont de plus en plus décriées, assimilées à « l'esclavage moderne » ou des ateliers clandestins 2.0.
Alexandr Wang, fondateur de l'entreprise Scale AI.
Alexandr Wang, fondateur de l'entreprise Scale AI. (Crédits : Scale AI)

Sa dernière levée de fonds énormissime - 1 milliard de dollars - n'a pas fait tant de bruit. Et pour cause : Scale AI est une entreprise de l'ombre. Celle qui se définit comme « une fonderie de données » travaille pour le compte de géants dans la lumière : Microsoft, Meta, la coqueluche de l'intelligence artificielle OpenAI, mais aussi des constructeurs automobiles et l'armée américaine. Scale AI labellise et vérifie les données utilisées par ces organisations pour entraîner leurs modèles d'intelligence artificielle. Pour obtenir des résultats plus précis et de meilleure qualité, ces systèmes ont besoin de données précises et de bonne qualité. Et c'est à ce niveau qu'opère l'entreprise californienne. C'est elle notamment qui s'assure de filtrer ChatGPT de tout contenu violent et haineux, et qui édite certaines de ses productions pour éviter qu'il ne produise du charabia. C'est elle aussi qui étiquette des photos d'arbres ou de piétons, pour éviter que les futurs véhicules autonomes ne les confondent.

Ses nouveaux financements lui sont notamment apportés par le fabricant de puces Nvidia, Amazon, Meta, le fonds américain Accel, l'incubateur Y Combinator (qui fait partie de ses investisseurs historiques), ou encore Nat Friedman, ex-dirigeant de Github devenu le business angel préféré de l'industrie. Scale AI avait auparavant levé environ 600 millions de dollars depuis son lancement en 2016, dont une série E de 325 millions de dollars en 2021 qui l'a valorisée à environ 7 milliards de dollars. Trois ans plus tard, et malgré une période plus compliquée durant laquelle elle a licencié 20 % de ses effectifs l'année dernière, Scale AI est désormais valorisée à 13,8 milliards de dollars.

Créer une « abondance de données » pour atteindre « GPT-10 »

« Notre vision est celle d'une abondance de données, où nous disposons des moyens de production nécessaires pour continuer à mettre à l'échelle les LLM d'avant-garde sur plusieurs ordres de grandeur. Nous ne devrions pas être limités par les données pour atteindre le GPT-10 », précise Alexandr Wang, fondateur de l'entreprise. Pour le dirigeant, le problème de la « pénurie de données », souvent source d'inquiétude dans le secteur, est un choix. Il estime que son entreprise est capable de livrer « une abondance de données ». Il estime que pour cela, il faut aller au-delà des données simplement accessibles en ligne.

Lire aussiIntelligence artificielle : 16 géants (OpenAI, Google, Microsoft, Meta...) s'engagent vers plus de sécurité

Dans une interview accordée au podcast Not Prior, le jeune dirigeant explique un peu plus clairement la problématique. « Depuis que nous travaillons sur le sujet de l'IA générative (...) les ambitions ont considérablement augmenté. Nous sommes passés de GPT-3, qui était une étape importante, mais restait un modèle modeste à aujourd'hui où nous souhaitons créer des agents autonomes, capables de raisonner, de maîtriser différents supports et différentes langues... »

Pour atteindre ces objectifs bien plus ambitieux, les modèles ne peuvent plus se contenter de lire des commentaires sur Reddit et autres textes facilement accessibles en ligne, explique-t-il. Il leur faut des données de valeur, qu'il nomme des « données d'avant-garde » (frontier data). Cela peut être la transcription du raisonnement des meilleurs experts ou encore des données issues d'entreprises...

Pour produire ces données, Scale AI fait donc appel depuis deux ans à des experts de différents domaines : des mathématiciens, physiciens, journalistes sportifs, écrivains, historiens, poètes, des spécialistes d'une langue en particulier... Leur rôle : réviser les productions des grands modèles de langage, ou produire des contenus inédits qui serviront à les entraîner.

4 heures de travail pour 20 centimes

Bien qu'essentiel au développement de l'intelligence artificielle, le travail de Scale AI n'est pas toujours reluisant.  À l'été 2023, le Washington Post compare les conditions de travail de Scale AI à celle d'un « digital sweatshop » (atelier clandestin numérique). Le média américain est parti à la rencontre de Philippins qui travaillent pour Scale AI. Tous sont indépendants et travaillent de chez eux ou dans des cybercafés. Ils se plaignent de retard ou d'annulation de paiement, d'un salaire de misère (souvent en dessous de la moyenne nationale comprise entre 6 et 10 dollars par jour selon les régions). Charisse, 23 ans, dit par exemple avoir travaillé 4 heures pour une tâche qui devait être payée 1 dollar. Elle a finalement reçu 30 centimes. Interrogée, une porte-parole de Scale AI affirme que les conditions de paiement « s'améliorent de jour en jour ».

Au cœur de cette investigation : la plateforme Remotetasks, détenue par Scale AI. Celle-ci permet à des indépendants du monde entier (240 000 selon la plateforme) de se connecter pour travailler « à la tâche ». Plus celle-ci est complexe, mieux ils sont censés être rémunérés. C'est ce qu'annonce Remotetasks sur la page d'accueil de son site. La rémunération dépendrait aussi de la vitesse d'exécution et de la qualité du travail, indique le MIT Technology Review. Ce qui incite les travailleurs à accepter des charges de travail très intenses. Aux Philippines, il serait 10 000 à être connecté au site, rapporte le Washington Post. Mais la plateforme est aussi très présente au Kenya et au Venezuela.

Ce modèle parfois qualifié de « travail du clic » ou « digital labor » n'est pas nouveau. Il est même courant dans le monde de l'intelligence artificielle et dénoncé depuis plusieurs années par des chercheurs comme le sociologue Antonio Casilli et la spécialiste du travail numérique Sarah Roberts. C'est notamment le modèle d'Amazon Mechanical Turks, qui existe depuis 2005 et qui emploie des dizaines de milliers de personnes. Une multitude d'autres sites utilisent ce système : Appen, Hive Micro, ou encore Mighty AI. Toutes sont basées aux États-Unis.

97 travailleurs kényans qui dénoncent un « esclavage moderne »

Ces derniers mois, les travailleurs de ces plateformes, et notamment de Scale AI, se sont davantage mobilisés pour réclamer de meilleures conditions de travail et de rémunération.

Lire aussiIntelligence artificielle : quel rôle pour les chercheurs dans 30 ans ?

Le 22 mai dernier, 97 travailleurs kényans ont notamment publié une lettre ouverte adressée au président Joe Biden (alors en visite dans leur pays), relayée par le magazine Wired. Ces derniers se décrivent comme des « data labellers » (étiqueteurs de données) travaillant pour Scale AI, et d'autres sous-traitants de Meta, TikTok et OpenAI.

« Nos conditions de travail s'apparentent à de l'esclavage moderne, écrivent-ils. Nous effectuons ce travail au prix de notre santé, de nos vies et de nos familles. Les géants américains de la technologie exportent leurs emplois les plus difficiles et les plus dangereux à l'étranger. Ce travail est épuisant sur le plan mental et émotionnel. Nous nettoyons le web (...) Nous étiquetons des images et des textes pour former des outils d'IA générative comme OpenAI. Notre travail consiste à regarder des meurtres et des décapitations, des abus et des viols d'enfants, de la pornographie et de la bestialité, souvent pendant plus de 8 heures par jour. Beaucoup d'entre nous font ce travail pour moins de 2 dollars de l'heure. »

Les experts de divers domaines cités plus haut, qui permettent à Scale AI de produire les données « d'avant-garde » pour OpenAI et consorts, sont eux aussi indépendants mais basés en Europe et aux États-Unis. Ils sont bien mieux payés : entre 30 et 60 dollars de l'heure. Mais ils souffrent eux aussi d'instabilité, rapporte Wired. La plateforme les déconnecte parfois brutalement, sans explication, les coupant de leurs revenus. Par ailleurs, souligne le média américain, ils travaillent pour une technologie qui rendra potentiellement leur travail obsolète. « Je transmets à la machine des connaissances que j'ai et qu'elle n'a pas », dit Jay (son prénom a été modifié à sa demande), un mathématicien d'une vingtaine d'années, payé par Remotasks pour dire à ChatGPT si ses raisonnements en mathématiques sont corrects ou non.

Sujets les + lus

|

Sujets les + commentés

Commentaires 5
à écrit le 25/05/2024 à 8:39
Signaler
"esclavage moderne " Ben oui beaucoup moins tolérable que l'esclavage ! Non mais oh ! ^^

à écrit le 24/05/2024 à 9:35
Signaler
Le premier rôle de L'IA c'est d'imaginer des solutions pour cueillir le Max de financements et de subventions..

à écrit le 24/05/2024 à 8:00
Signaler
A mourir de rire tandis que le dumping social est le passe temps de nos actionnaires milliardaires qui ne savent plus que tuer leur pathologique ennuie. Le moldave à 300 balles par mois c'est quoi ? L'esclavagisme salariale est une abomination qui ra...

le 24/05/2024 à 15:02
Signaler
Vous avez parfaitement raison : "le cauchemar ...est déjà là et depuis belle lurette." Mais puisque les esclavagistes ont décidé d'en remettre une couche, n'est-ce pas une occasion de gueuler une fois de plus? A moins que vous ne pensiez qu'on a si p...

le 24/05/2024 à 16:06
Signaler
Non, parce que ne jamais s'attaquer aux racines du problème c'est ne jamais s'attaquer au problème et c'est pas un hasard. "L'éternel recommencement" cette malédiction humaine qui devrait finir par nous anéantir vient de ça.

Votre email ne sera pas affiché publiquement.
Tous les champs sont obligatoires.

-

Merci pour votre commentaire. Il sera visible prochainement sous réserve de validation.