Comment le géant de l'image Getty se défend dans le Far West de l'IA générative

Fin 2022, Getty Images voyait son cœur d'activité menacé par des intelligences artificielles génératives comme Midjourney et Stable Diffusion, capables de créer des images sur-mesure en un clic et à moindre coût. Un an plus tard, le géant de l'image a présenté au CES de Las Vegas sa riposte : un nouvel outil, en partenariat avec Nvidia, qui génère des images qui ne froisseront aucun ayant droit, à l'inverse de ses concurrents.
François Manens
iStock permet de générer des photos grâce à l'intelligence artificielle générative.
iStock permet de générer des photos grâce à l'intelligence artificielle générative. (Crédits : Getty)

Combattre le feu par le feu, c'est le principe adopté par Getty Images. Menacé dans son business de vente d'images par l'émergence des intelligences artificielles capables de les générer en un clic, comme Midjourney, Stable Diffusion (Stability AI) ou encore Dall-e (OpenAI), le géant des banques d'images a riposté avec ses propres intelligences artificielles.

Au CES de Las Vegas, il a ainsi présenté son nouvel outil, destiné aux petites entreprises et au grand public, sobrement nommé « Generative AI by iStock » qui fait suite à « Generative AI by Getty Images », présenté en octobre. L'objectif de cette gamme : proposer une offre de génération d'images « commercialement sûre », dixit l'entreprise. Mais aussi « abordable », dans le cas d'iStock : pour un forfait de 13,99 euros (auquel il faut ajouter la TVA), l'utilisateur s'offre le droit de réaliser 100 générations de quatre images. Sa particularité par rapport à Midjourney et consorts ? Il s'appuie sur une intelligence artificielle entraînée sur les banques d'images de Getty. Autrement dit, l'entreprise a les droits d'exploitation de toutes les images qui ont nourri l'outil, ce qui lui évite, en théorie du moins, de créer des images qui enfreindrait un quelconque copyright.

Une IA générative sans risque, la promesse de Getty

A l'inverse de Getty Images, les spécialistes de l'IA les plus populaires naviguent en eaux troubles. Ils entraînent leurs modèles sur des millions d'images récupérées en masse depuis Internet, dont le détail n'est en général par divulgué. Pire, certains spécialistes se demandent même si les entreprises en connaissent elle-même le détail. En conséquence, les spécialistes de l'IA sont régulièrement accusés d'exploiter des images soumises au droit de la propriété intellectuelle, sans s'acquitter du paiement pourtant nécessaire d'une licence d'exploitation. D'ailleurs, Stability AI, le seul acteur qui divulgue la base d'images qui a servi à l'entraînement de son outil, a été poursuivi en justice par nul autre que Getty Images, dès janvier 2023. Ce dernier accusait le créateur d'IA d'exploiter illégalement des millions d'images dont il détient les droits...

Mais le problème est plus profond : il arrive aux IA génératives d'intégrer dans leurs images des figures ou symboles très fortement liés à des marques ou des personnes morales. En octobre 2023, le média américain 404 avait par exemple exposé que le générateur d'images de Bing, qui s'appuie sur DALL-E, permettait de créer des images de Bob l'éponge, le célèbre personnage de Nickelodeon... en train de commettre les attentats du 11 septembre 2001. L'outil avait dans la foulée été placé en maintenance, le temps de le régler pour empêcher les utilisateurs de reproduire des mauvaises blagues du même goût. Ce cas est symptomatique des problèmes des générateurs d'IA : les opérateurs de ces outils les corrigent au cas par cas, et ne semblent pas maîtriser les limites de leurs capacités. Résultat : les utilisateurs parviennent quasi systématiquement à les faire dévier, ce qui mène à une nouvelle crise.

Getty Images promet d'indemniser d'éventuels frais judiciaires

Les plus pessimistes voient dans ce mode de fonctionnement une véritable bombe à retardement, qui pourrait exploser à la fois à la figure des générateurs d'images, mais aussi à celles de leurs clients qui exploitent les images générées. Sauf que le débat autour des données utilisées dans l'entraînement des IA semble stagner, faute à un manque de transparence de la part des principales entreprises spécialisées. Mais cette situation pourrait n'être que de courte durée : les régulateurs, à commencer par l'Union européenne avec son IA Act, prévoient de demander aux créateurs d'IA de préciser les jeux de données qui ont servi à entraîner les grands modèles.

Avec ses IA à l'entraînement bien encadré, Getty Images promet aux entreprises de s'éviter cette épée de Damoclès. D'ailleurs, il accompagne chaque image générée d'une couverture légale jusqu'à 10.000 dollars, une garantie calquée sur celle des images classiques. Autrement dit, il s'engage à indemniser les frais juridiques en cas de procès lié à l'utilisation d'une image générée par son outil. Getty précise également que les images créées resteront exclusivement la propriété de l'utilisateur et ne seront pas ajoutées à la bibliothèque d'images générées par IA, que l'entreprise entretient par ailleurs.

Nvidia, l'allié de choix face aux spécialistes de l'intelligence artificielle

Pour créer son nouvel outil, Getty a utilisé Nvidia Picasso, une boîte à outils destinée à créer des modèles sur mesure. L'entreprise américaine, incontournable avec ses processeurs d'IA, développe depuis un an une offre de logiciels qui consistent à armer les entreprises de différents secteurs pour qu'elles créent leurs propres IA. En résumé : elle fournit l'architecture d'IA -ici, le modèle baptisé Edify- et les méthodes d'entraînement, tandis que ses clients fournissent les données. Picasso cartonne chez les spécialistes de l'image : Adobe l'a utilisé pour créer son générateur d'images, Firefly, et défendre sa position sur le marché. Tout comme Shutterstock, un concurrent de Getty.

Pour créer une image, l'utilisateur doit détailler son souhait dans un prompt, c'est-à-dire une consigne textuelle. Afin d'affiner le résultat final, l'outil le pousse à répondre à quatre questions supplémentaires : Sur qui se concentre l'image ? Que se passe‑t‑il dans la scène ? Où se déroule l'action ? Quelle est l'ambiance ou le style visuel ? Une façon, pour Getty, de prendre par la main les utilisateurs les moins expérimentés, afin qu'ils obtiennent tout de même des résultats satisfaisants.

L'outil devrait intégrer les fonctionnalités de inpainting (qui permet d'insérer un élément dans l'image avec un prompt) et de outpainting (qui permet d'étendre l'image en toute cohérence) d'ici la fin de l'année, à l'instar de Firefly. Avec leurs intelligences artificielles performantes et plus sécurisées, les acteurs traditionnels ne seraient-ils pas en train de renverser le rapport de force avec les spécialistes de l'IA ?

François Manens

Sujets les + lus

|

Sujets les + commentés

Commentaire 1
à écrit le 10/01/2024 à 7:29
Signaler
C'est le moment de créer et de dire à nos jeunes de créer au lieu de les envoyer dans les bunkers d'amazone obéir à des machines.

Votre email ne sera pas affiché publiquement.
Tous les champs sont obligatoires.

-

Merci pour votre commentaire. Il sera visible prochainement sous réserve de validation.