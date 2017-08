Au cours des cinq dernières années, les groupes médias se sont tous dotés de Data Management Platform (DMP), des bases de données centralisant les données des utilisateurs. C'était un premier pas vers la science des données, mais les DMP restaient à vocation publicitaire exclusivement : agréger des cookies, identifier des segments d'audience et optimiser le ciblage publicitaire.

Or, aujourd'hui, l'essor de l'intelligence artificielle crée une multitude d'opportunités et de nouvelles approches qui révolutionnent l'ensemble de la chaîne de valeur des médias, et leurs métiers :

Prédiction et stratégie de contenus : prédire quel contenu produire sur la base de données passées de consommation. C'est l'approche opérée par Netflix pour choisir quelle série produire, ou bien Buzzfeed pour déterminer quel article rédiger. L'IA et la data science peuvent ainsi permettre aux rédacteurs en chef d'orienter leurs stratégies de contenus : quelles verticales ou thématiques traiter ? Quelle est la durée optimale des vidéos ? Quel format marche le mieux ? Quels segments d'audience ont été délaissés ?

Production : On voit apparaître de plus en plus d'outils reposant sur l'IA pour produire des contenus de façon (semi) automatique et à faible coût. Si la qualité et l'image de marque sont aujourd'hui discutables, ces solutions ne vont faire que s'améliorer au cours du temps, et d'ici quelques années la qualité sera sans doute comparable à un rendu professionnel.

Personnalisation : montrer le bon contenu à la bonne personne au bon moment. Ceci n'est pas nouveau, on en parle depuis 2005 (à l'époque on appelait ceci le Web 2.0), mais les avancées récentes en IA rendent les algorithmes de recommandation un ordre de grandeur plus performants.

Ciblage publicitaire : Afficher la bonne publicité à la bonne personne au bon moment. Le rêve de tout annonceur. Encore une fois, ceci n'est pas nouveau et a même donné naissance à toute une industrie appelée Ad-Tech. Ceci dit, l'explosion des données disponibles et la sophistication des algorithmes rendent le ciblage exponentiellement plus performant.

Audit et Contrôle : les systèmes de détection de fraude, spam et autres robots reposent tous sur de l'IA.

Mais pour vraiment briller, l'IA a besoin d'une quantité de données massive, issues d'un maximum de sources :

Sur le contenu : titre, metadata, tags, catégories, etc.

Sur les visiteurs : données démographiques, localisation, etc.

Sur l'historique de consommation : page vues, vidéos vues, temps passé, etc.

Sur le contexte de lecture : quel device, heure, jour de la semaine, etc.

Sur des événements externes : sujets "trending" sur les réseaux sociaux, événements live, la météo, etc.

Le véritable enjeu, c'est le carburant : la donnée

L'IA est comme une fusée dont les principaux éléments sont un châssis (c'est-à-dire le contenant), un énorme moteur, et une quantité phénoménale de carburant. Le châssis représente les serveurs, mais c'est aujourd'hui devenu un commodité : avec le cloud computing, il faut trois clics pour lancer un cluster de serveurs ultra-performants et adaptés à L'IA. Le moteur représente les algorithmes, mais ceux-ci sont également accessibles simplement avec des librairies bien documentées et souvent open source.

Le véritable enjeu se trouve dans le carburant : la donnée. C'est devenu un vrai or noir qu'il faut puiser et raffiner. Google et Facebook l'ont très bien compris et sont devenus de véritables forteresses de données.

L'intelligence artificielle expliquée avec des fusées

Mais traditionnellement, les données et applications mentionnées plus-haut sont gérées chez les médias par différentes équipes qui ne communiquent pas entre elles : la stratégie de contenu est établie par les directeurs, la production par les éditeurs, la personnalisation par l'équipe produit, et le ciblage publicitaire par la régie. Il s'agit de silos indépendants, aucun n'a de vue d'ensemble.

Centralisation des données au sein d'une plateforme d'IA horizontale

A l'inverse, lorsque les différentes sources de données sont agrégées et combinées, l'IA permet de mettre en évidence des corrélations extrêmement subtiles. Prenons l'exemple d'un moteur de recommandation multi-couches :

Nous avons à gauche les données en entrée, au centre les couches intermédiaires, et à droite la recommandation en sortie. En combinant "Mobile" et "Wednesday 8am EST", le système prédit que l'utilisateur est dans les transports, et par conséquent qu'il va préférer des contenus courts. En combinant la localisation "Manhattan", le genre "féminin", et l'historique de navigation incluant le site "Vanity Fair", le système déduit l'intérêt "Fashion", qui combiné avec la tendance Twitter "#FashionWeekParis", devient un signal encore plus fort. Ainsi, le système va tester des millions de combinaisons des différents points d'entrée, avant de délivrer sa recommandation.

On comprend donc qu'un système aussi sophistiqué ne peut exister que si toutes les sources de données sont centralisées au sein d'une plateforme d'IA horizontale, au sein de laquelle toutes les équipes vont brancher leurs données. Au cours des prochaines années, nous allons probablement voir émerger ce type de plateformes capables d'importer, nettoyer, unifier, stocker ces données, puis d'utiliser l'IA afin d'affiner cette donnée et d'appliquer des algorithmes métiers permettant de résoudre des problèmes bien précis. 80% des efforts se trouvent dans la mise en place du pipeline de données (agrégation, formattage, stockage) et seulement 20% à concevoir et affiner les algorithmes d'IA.

Sans parler des enjeux de vie privée et de protection des données qui sont bien sûr essentiels, les médias doivent prendre conscience de la révolution qui est en train de s'opérer, et mettre en place les actions nécessaires afin de placer l'IA au centre de leur organisation.

Par Denis Vilar,

co-fondateur de Pulpix, une plateforme d'engagement vidéo.