L'IA de Google plus efficace que l'homme pour lire sur les lèvres

Publié le 25 novembre 2016 à 16:51 - Mis à jour le 25 novembre 2016 à 16:55

Ajouter La Tribune à vos sources préférées

Google poursuit ses travaux de recherche sur l'intelligence artificielle et annonce de nouvelles performances de son outil DeepMind. Quelques mois après avoir battu des champions au jeu de Go, DeepMind serait capable de lire sur les lèvres avec des performances bien supérieures à celles de l'homme.

Des chercheurs de la société DeepMind qui appartient à Google et des scientifiques de l'université d'Oxford ont utilisé l'intelligence artificielle pour développer "le logiciel le plus efficace pour lire sur les lèvres" selon The Verge. Pour mettre en application cet outil, les deux organisations ont travaillé dans une étude sur la retranscription de programmes audiovisuels.

Des milliers d'heures de programmes avalés

Le programme développé par les chercheurs a été confronté à plus de 5.000 heures de programmes de la BBC. Au total, les vidéos contenaient un corpus de 118.000 phrases. Le travail s'est divisé en deux parties. Dans un premier temps, l'Intelligence artificielle a dû assimiler tous les programmes entre janvier 2010 et décembre 2015 afin de constituer une base de données. Et dans une seconde étape, les chercheurs ont testé les performances de l'outil sur des programmes diffusés entre mars et septembre 2016. L'objectif de ce travail était de mesurer l'efficacité de DeepMind pour la retranscription de sous-titres à partir du mouvement des lèvres.

Un clip issu de la base de données sans sous-titres. Crédits : newscientist

Et le même clip avec les sous-titres fournis par l'intelligence artificielle. Crédits : newscientist

En regardant simplement les lèvres de chaque présentateur, le système réussit à déchiffrer des phrases entières souligne Newscientist.

Newsletter

Tech & IA

Chaque jour à 13h, l’essentiel de l’actualité tech.

Des performances supérieures à l'homme

L'équipe de chercheurs a ainsi confronté les résultats d'un professionnel avec ceux de la machine. Il apparaît que cette dernière est capable de retranscrire avec précision 48% des mots prononcés contre 12,6% pour l'homme. Les performances de l'IA dépassent désormais les compétences de l'homme pour ce type de tâche.

Des applications multiples

Les chercheurs de Deepmind ont suggéré que ce programme pourrait aider les personnes sourdes et malentendantes à comprendre les conversations. Il pourrait également permettre d'améliorer les performances des assistants vocaux comme Google Home.

Tensions sur l'hélium : pourquoi la décision de Pékin menace l'industrie et la santé en Europe

L'hélium, gaz irremplaçable pour l'IA et l'imagerie médicale, est au cœur d'une crise mondiale. La suspension des exportations chinoises, sur fond de tensions géopolitiques, révèle la fragilité des chaînes d'approvisionnement et l'urgence pour l'Europe de trouver des alternatives.

Intelligence Artificielle

Olivier Dellenbach, le fondateur de Chapsvision.

« Trump est devenu la face visible d’une relation avec les États-Unis qui a toujours existé » (Olivier Dellenbach, Chapsvision)

ENTRETIEN. Le fondateur de Chapsvision, dont la plateforme d'analyse de données vient d’être retenue par la Sécurité intérieure française, nous partage sa vision de la souveraineté et répond à nos interrogations sur les limites éthiques de ce type d’outils.

Intelligence Artificielle

Nubia a présenté le NaviX Ultra, équipé de Doubao, l'assistant conversationnel développé par ByteDance, maison mère de TikTok.

Les smartphones à agents IA ouvrent un nouveau front dans la bataille des plateformes

Les fabricants chinois multiplient les smartphones capables d'exécuter des tâches à la place de leurs utilisateurs grâce à des agents d'intelligence artificielle. Une évolution qui pourrait bouleverser l'économie des applications, au point de pousser plusieurs géants du numérique à verrouiller l'accès à leurs services.

Tech & IA

L’IA agentique, qui promet d'automatiser un certain nombre d'usages en ligne dont le shopping, inquiète l'Autorité de la concurrence

« Cet avis est un signal d’alarme » : l'inquiétude de l'Autorité de la concurrence sur les agents IA

Dans un avis présenté comme un « signal d’alarme », l’Autorité française estime que le développement des agents IA, fortement concentrés autour de trois acteurs (OpenAI, Anthropic et Google), ouvre la voie au remplacement ou à la disparition d’acteurs de l'économie numérique.

Intelligence Artificielle

Yang Zhilin, fondateur de Moonshot AI, lors d'une conférence du forum Zhongguancun 2026, à Pékin.

DeepSeek casse les prix, Moonshot veut tout intégrer : comment l’IA chinoise attaque les modèles américains

DeepSeek a fait irruption avec un modèle open source jusqu’à 85 % moins cher que GPT5.5, pendant que Moonshot AI aligne ses modèles Kimi et K2 pour rivaliser avec ChatGPT et Claude sur le code et le raisonnement. Derrière ce duo de “tigres” de l’IA, Pékin teste une stratégie diplomatique : casser les prix, séduire les entreprises occidentales et proposer au Sud global des alternatives complètes aux services américains.

Intelligence Artificielle

Alibaba, ByteDance, Meituan... Une myriade d'acteurs chinois à la conquête de l'IA

Malgré les restrictions américaines sur les semi-conducteurs, la Chine accélère dans l'intelligence artificielle en s'appuyant sur une nouvelle vague de champions capables de rivaliser avec les géants de la Silicon Valley.

Tech & IA

Au-delà de la bataille industrielle, la Chine cherche également à s'imposer comme un acteur central de la régulation mondiale de l'intelligence artificielle.

Pékin contre Washington : la guerre de l'IA change d'échelle

Le président chinois Xi Jinping a accusé les États-Unis de vouloir monopoliser l'intelligence artificielle et appelé à un nouvel ordre mondial de l'IA, au moment où Pékin accélère sa course pour rattraper son rival technologique.

Tech & IA

Bouygues Telecom se met en état de marche avant d’absorber SFR

Une réorganisation de l’opérateur est prévue ce mois de septembre. Initiée avant l’accord avec Altice France, elle devrait cependant permettre d’intégrer plus efficacement les actifs de SFR Business si la vente se confirme.

Télécoms

L'IA de Google plus efficace que l'homme pour lire sur les lèvres

Des milliers d'heures de programmes avalés

Tech & IA

Des performances supérieures à l'homme

Des applications multiples

Sur le même sujet

Tensions sur l'hélium : pourquoi la décision de Pékin menace l'industrie et la santé en Europe

« Trump est devenu la face visible d’une relation avec les États-Unis qui a toujours existé » (Olivier Dellenbach, Chapsvision)

Les smartphones à agents IA ouvrent un nouveau front dans la bataille des plateformes

« Cet avis est un signal d’alarme » : l'inquiétude de l'Autorité de la concurrence sur les agents IA

DeepSeek casse les prix, Moonshot veut tout intégrer : comment l’IA chinoise attaque les modèles américains

Alibaba, ByteDance, Meituan... Une myriade d'acteurs chinois à la conquête de l'IA

Pékin contre Washington : la guerre de l'IA change d'échelle

Bouygues Telecom se met en état de marche avant d’absorber SFR

Des milliers d'heures de programmes avalés

Tech & IA

Des performances supérieures à l'homme

Des applications multiples

Sur le même sujet

Tensions sur l'hélium : pourquoi la décision de Pékin menace l'industrie et la santé en Europe

« Trump est devenu la face visible d’une relation avec les États-Unis qui a toujours existé » (Olivier Dellenbach, Chapsvision)

Les smartphones à agents IA ouvrent un nouveau front dans la bataille des plateformes

« Cet avis est un signal d’alarme » : l'inquiétude de l'Autorité de la concurrence sur les agents IA

DeepSeek casse les prix, Moonshot veut tout intégrer : comment l’IA chinoise attaque les modèles américains

Alibaba, ByteDance, Meituan... Une myriade d'acteurs chinois à la conquête de l'IA

Pékin contre Washington : la guerre de l'IA change d'échelle

Bouygues Telecom se met en état de marche avant d’absorber SFR