Comment l’intelligence artificielle bouleverse l’industrie des médias

 |   |  1001  mots
Denis Vilar.
Denis Vilar. (Crédits : DR)
Les récentes avancées en intelligence artificielle (IA) ont permis la naissance de nombreuses applications et outils qui changent profondément le métier des médias. Ceux-ci doivent s’adapter et placer l’IA au cœur de leur organisation. Par Denis Vilar, cofondateur de Pulpix.

Au cours des cinq dernières années, les groupes médias se sont tous dotés de Data Management Platform (DMP), des bases de données centralisant les données des utilisateurs. C'était un premier pas vers la science des données, mais les DMP restaient à vocation publicitaire exclusivement : agréger des cookies, identifier des segments d'audience et optimiser le ciblage publicitaire.

Or, aujourd'hui, l'essor de l'intelligence artificielle crée une multitude d'opportunités et de nouvelles approches qui révolutionnent l'ensemble de la chaîne de valeur des médias, et leurs métiers :

  • Prédiction et stratégie de contenus : prédire quel contenu produire sur la base de données passées de consommation. C'est l'approche opérée par Netflix pour choisir quelle série produire, ou bien Buzzfeed pour déterminer quel article rédiger. L'IA et la data science peuvent ainsi permettre aux rédacteurs en chef d'orienter leurs stratégies de contenus : quelles verticales ou thématiques traiter ? Quelle est la durée optimale des vidéos ? Quel format marche le mieux ? Quels segments d'audience ont été délaissés ?
  • Production : On voit apparaître de plus en plus d'outils reposant sur l'IA pour produire des contenus de façon (semi) automatique et à faible coût. Si la qualité et l'image de marque sont aujourd'hui discutables, ces solutions ne vont faire que s'améliorer au cours du temps, et d'ici quelques années la qualité sera sans doute comparable à un rendu professionnel.
  • Personnalisation : montrer le bon contenu à la bonne personne au bon moment. Ceci n'est pas nouveau, on en parle depuis 2005 (à l'époque on appelait ceci le Web 2.0), mais les avancées récentes en IA rendent les algorithmes de recommandation un ordre de grandeur plus performants.
  • Ciblage publicitaire : Afficher la bonne publicité à la bonne personne au bon moment. Le rêve de tout annonceur. Encore une fois, ceci n'est pas nouveau et a même donné naissance à toute une industrie appelée Ad-Tech. Ceci dit, l'explosion des données disponibles et la sophistication des algorithmes rendent le ciblage exponentiellement plus performant.

  • Audit et Contrôle : les systèmes de détection de fraude, spam et autres robots reposent tous sur de l'IA.

Mais pour vraiment briller, l'IA a besoin d'une quantité de données massive, issues d'un maximum de sources :

  • Sur le contenu : titre, metadata, tags, catégories, etc.
  • Sur les visiteurs : données démographiques, localisation, etc.
  • Sur l'historique de consommation : page vues, vidéos vues, temps passé, etc.
  • Sur le contexte de lecture : quel device, heure, jour de la semaine, etc.
  • Sur des événements externes : sujets "trending" sur les réseaux sociaux, événements live, la météo, etc.

Le véritable enjeu, c'est le carburant : la donnée

L'IA est comme une fusée dont les principaux éléments sont un châssis (c'est-à-dire le contenant), un énorme moteur, et une quantité phénoménale de carburant. Le châssis représente les serveurs, mais c'est aujourd'hui devenu un commodité : avec le cloud computing, il faut trois clics pour lancer un cluster de serveurs ultra-performants et adaptés à L'IA. Le moteur représente les algorithmes, mais ceux-ci sont également accessibles simplement avec des librairies bien documentées et souvent open source.

Le véritable enjeu se trouve dans le carburant : la donnée. C'est devenu un vrai or noir qu'il faut puiser et raffiner. Google et Facebook l'ont très bien compris et sont devenus de véritables forteresses de données.

L'intelligence artificielle expliquée avec des fusées

rocket

Mais traditionnellement, les données et applications mentionnées plus-haut sont gérées chez les médias par différentes équipes qui ne communiquent pas entre elles : la stratégie de contenu est établie par les directeurs, la production par les éditeurs, la personnalisation par l'équipe produit, et le ciblage publicitaire par la régie. Il s'agit de silos indépendants, aucun n'a de vue d'ensemble.

Centralisation des données au sein d'une plateforme d'IA horizontale

A l'inverse, lorsque les différentes sources de données sont agrégées et combinées, l'IA permet de mettre en évidence des corrélations extrêmement subtiles. Prenons l'exemple d'un moteur de recommandation multi-couches :

arborescence multicouche, Denis Vilar, opinion, intelligence artificielle, médias, Pulpix, vidéo,

Nous avons à gauche les données en entrée, au centre les couches intermédiaires, et à droite la recommandation en sortie. En combinant "Mobile" et "Wednesday 8am EST", le système prédit que l'utilisateur est dans les transports, et par conséquent qu'il va préférer des contenus courts. En combinant la localisation "Manhattan", le genre "féminin", et l'historique de navigation incluant le site "Vanity Fair", le système déduit l'intérêt "Fashion", qui combiné avec la tendance Twitter "#FashionWeekParis", devient un signal encore plus fort. Ainsi, le système va tester des millions de combinaisons des différents points d'entrée, avant de délivrer sa recommandation.

On comprend donc qu'un système aussi sophistiqué ne peut exister que si toutes les sources de données sont centralisées au sein d'une plateforme d'IA horizontale, au sein de laquelle toutes les équipes vont brancher leurs données. Au cours des prochaines années, nous allons probablement voir émerger ce type de plateformes capables d'importer, nettoyer, unifier, stocker ces données, puis d'utiliser l'IA afin d'affiner cette donnée et d'appliquer des algorithmes métiers permettant de résoudre des problèmes bien précis. 80% des efforts se trouvent dans la mise en place du pipeline de données (agrégation, formattage, stockage) et seulement 20% à concevoir et affiner les algorithmes d'IA.

Sans parler des enjeux de vie privée et de protection des données qui sont bien sûr essentiels, les médias doivent prendre conscience de la révolution qui est en train de s'opérer, et mettre en place les actions nécessaires afin de placer l'IA au centre de leur organisation.

___

Par Denis Vilar,
co-fondateur de Pulpix, une plateforme d'engagement vidéo.

Réagir

Votre email ne sera pas affiché publiquement
Tous les champs sont obligatoires

Commentaires
a écrit le 14/08/2017 à 13:22 :
Moins de journalistes , le retour de l'intelligence ...
a écrit le 14/08/2017 à 11:09 :
L'intelligence artificielle se définit comme le contraire de la bêtise naturelle. - Woody Allen
a écrit le 13/08/2017 à 14:22 :
Definition du moins très élargie de l'IA !
a écrit le 13/08/2017 à 12:30 :
Alors qu'est que dit l'IA, on doit supprimer combien de postes et de vie pour arriver à équilibrer les comptes ?
a écrit le 13/08/2017 à 12:22 :
Ce que les médias ne disent pas :
L'intelligence artificielle est utilisé déjà sous mitterand quand il a fait vote le questionnaire sur le recensement et gardé les données sur des plates-formes informatiques, ces données sont exploités dans toutes les politiques sociales et fiscales, la crise financière et sociale nous le devons à cette exploitation de données avec l'intelligence artificielle, ils ont dû calculer les retraites jusqu'à en 2050 et tous les paramètres....
Réponse de le 15/08/2017 à 7:13 :
Mitterrand 1974-1988 ( a l'époque le portable n'existait pas ...Internet était réservé a une élite ...).

De plus exploiter des données de 1985 pour établir des sources fiables jusqu'en 2050 ...Êtes vous sur ?
a écrit le 12/08/2017 à 19:36 :
On comprend que les gens dénué d'intelligence soient intéressés par cette intelligence artificielle qui n'en est pas une qui est seulement un affinement de la programmation.

Inquiétant.
a écrit le 11/08/2017 à 23:23 :
Notez ... ils n'en n'avaient déjà pas une vraie...
a écrit le 11/08/2017 à 19:38 :
Ouais, remplacer ce qui me plaît justement dans ce job. Libre arbitre, propre maturation des idées, envie de traiter des thèmes non imposés. Si tout le monde traite des mêmes sujets suggérés pas des machines, alors c'est le début de la dictature. Que les scientifiques se servent de l'IA à des fins médicales ou environnementales, OK, mais qu'ils laissent les sciences humaines... à l'homme.
a écrit le 11/08/2017 à 18:58 :
quand on discute avec certains datascientist et qu'on entend les conneries que certains jeunes sans experience peuvent sortir....
pour le reste, netflix avait a un moment donne une compet de datamining avec un prix de 1 million de dollars ( ca permet de faire travailler bcp de gens pour pas trop cher, la r&d, personne ne veut payer)
maintenant ils gardent leurs donnees!
;-)
on verra a l'avenir les degats chez certains qui n'ont rien compris, comme on a vu ca chez des idiots qui ont mis en place des erp pas adaptes ( je ne donne pas de noms)
Réponse de le 11/08/2017 à 21:42 :
Kaggle aussi : https://www.kaggle.com/competitions

Les compétitions permettent de faire bien plus de chose à moindre coût.

Merci pour votre commentaire. Il sera visible prochainement sous réserve de validation.

 a le à :