Les data synthétiques, porte d'entrée des entreprises vers l'IA générative visuelle
Alexandre de Vigan

Alexandre de Vigan.
DR
Alexandre de Vigan

Alexandre de Vigan.
DR
Un « Viking » à six doigts, prenant la pose devant une mer étrangement penchée, sur laquelle semble voguer une sorte de porte-conteneurs en bois : une vision à faire blêmir les historiens des civilisations nordiques. Le « fail » aurait pu se contenter de faire sourire s'il n'était signé Le Monde, le quotidien de référence qui cherchait à illustrer le numéro de son supplément du dimanche consacré, en novembre dernier, aux guerriers scandinaves. Au-delà de la polémique qu'a soulevé l'utilisation, pour le moins approximative, de l'intelligence artificielle (IA) générative par le journal, cette mésaventure aura eu pour mérite de mettre en lumière les limites du recours à l'IA créative par des entreprises n'en maîtrisant pas les codes.
Non que l'IA en soit à ses premiers ratés. Avec le succès retentissant des Midjourney et autres DALL-E, nous avons tous, ces derniers mois, vu déferler ces images étranges, à la fois si proches de la réalité et si dérangeantes. L'IA dans ses diverses applications a, par ailleurs, souvent joué des tours aux entreprises qui l'ont déployée trop précipitamment : on se souvient du chatbot de DPD qui se moquait de son propre employeur ; de celui d'Air Canada promettant des tarifs erronés aux clients de la compagnie ; ou encore des sorties vulgaires et racistes de Tay, le robot conversationnel de Microsoft. Mal intégrée à l'entreprise ou insuffisamment éduquée, l'IA peut en effet engendrer de sérieux dommages de réputation ainsi qu'une charge de travail supplémentaire pour « réparer » ses erreurs.
Ces incidents ont dissuadé nombre d'entreprises de s'approprier les outils créatifs de génération d'images par IA. Adaptés aux artistes ou aux particuliers, ces outils ne correspondent pas encore aux exigences, plus élevées, des entreprises en termes de marketing, de médias, de branding, de merchandising, etc. Et pour cause : par définition, les applications d'IA créatives actuellement sur le marché n'ont été ni conçues, ni formées, pour s'adapter aux lignes directrices qui définissent et protègent l'image de marque des entreprises. Y avoir recours implique donc, forcément, une intervention humaine afin de s'assurer que ces créations ne nuisent pas à l'image et à la réputation de l'entreprise.
Les outils disponibles aujourd'hui ne permettent pas, non plus, de garantir une forme de cohérence dans les visuels « hallucinés » par l'IA. Ils ne répondent pas davantage aux exigences qualitatives des entreprises, celles-ci devant, a minima, s'assurer du contrôle de leurs créations par des superviseurs humains. De même, il demeure nécessaire d'opérer une surveillance humaine des images générées pour être certain que ces dernières respectent le scénario prédéfini et n'enfreignent pas les règles régissant la propriété intellectuelle. Enfin, les outils dont nous disposons aujourd'hui sont difficilement évolutifs et ne permettent pas l'implication de différents services ou collaborateurs sans rompre avec les objectifs de cohérence et de qualité.
En d'autres termes, les outils d'IA visuelle ne peuvent, pour le moment, être pleinement utilisés par les entreprises. Et, dans tous les cas, pas sans nécessiter de lourdes interventions manuelles annulant, de fait, le gain de temps initial. Moins de ressources pour créer, plus pour guider l'IA et contrôler son travail : l'équation est nulle. Sortir de cette impasse est pourtant possible : pour ce faire, il convient d'entraîner l'outil ou l'application d'IA à la marque de l'entreprise, de le familiariser, en quelque sorte, aux exigences et lignes directrices de celle-ci. Cette étape n'a rien d'inaccessible ; bien connue des développeurs, il s'agit de la « mise au point du modèle ». C'est-à-dire, tout simplement, l'entraînement du modèle avec des données représentant les lignes directrices que souhaite voir respecter l'entreprise.
L’actualité qui compte pour vous, chaque jour dans votre boîte mail.

C'est en alimentant le moteur de l'IA avec ces données spécifiques et adaptées à l'utilisation qu'en fera l'entreprise que ce modèle apprendra à reproduire les lignes directrices de l'entreprise ; que ces dernières soient souples ou rigides, qu'elles concernent les couleurs, les styles, les éclairages, etc. Ce réglage fin permet de contrôler la génération de l'image et d'automatiser le contrôle de sa qualité, en garantissant le respect des lignes directrices, la cohérence et l'aspect contrôlable de l'image. C'est ce que propose déjà, par exemple, Adobe avec son application Firefly.
Le secret ? Les données d'entrainement, qui combinent données existantes chez le client et données synthétiques. A la différence des premières, qui seront insuffisantes à court terme pour entraîner les moteurs d'IA - et le seront encore plus avec la prochaine génération d'IA -, les secondes sont 100 % artificielles, générées par ordinateur pour tel ou tel cas d'utilisation, et imitent les données réelles en répondant à des critères très précis : quantité, qualité, absence de propriété intellectuelle, etc. Par ailleurs, les données réelles sont en général peu accessibles et pas suffisamment spécifiques au cas d'utilisation.
À lire également
Les données synthétiques fonctionnent ici comme un plug-in pour les données préexistantes, parfaitement adaptées à l'usage que l'on souhaite en faire. Combinant données « passées » de l'entreprise et données synthétiques, le modèle qui se dégage ici est singulièrement enrichi. Il permet de résoudre les contradictions inhérentes aux outils d'IA visuelle actuellement sur le marché. En somme, les données synthétiques sont la brique, ou la porte d'entrée, qui manquait encore aux entreprises pour s'emparer des outils d'IA visuelle et embrasser, pleinement, la révolution de l'intelligence artificielle.
Alexandre de Vigan