IA : le français Kyutai se lance dans la traduction simultanée
latribune.fr

Baptisée « Hibiki » ( « écho » en japonais), cette IA traduit les propos d'un utilisateur en temps réel du français vers l'anglais (Photo d'illustration).
Reuters
latribune.fr

Baptisée « Hibiki » ( « écho » en japonais), cette IA traduit les propos d'un utilisateur en temps réel du français vers l'anglais (Photo d'illustration).
Reuters
Les Français avancent aussi dans l'intelligence artificielle. Ce jeudi 6 février, Kyutai, le laboratoire français fondé par Xavier Niel, propriétaire du groupe Iliad, et Rodolphe Saadé, PDG du groupe CMA CGM (propriétaire de La Tribune) a dévoilé son dernier modèle expérimental dédié à la traduction simultanée.
Baptisée « Hibiki » ( « écho » en japonais), cette IA traduit les propos d'un utilisateur en temps réel du français vers l'anglais, comme le ferait « un interprète », a expliqué à l'AFP Neil Zeghidour, directeur de la modélisation chez Kyutai, qui compte également l'ancien patron de Google Eric Schmidt parmi son trio de cofondateurs.
Le modèle, qui peut fonctionner sur un téléphone sans avoir forcément accès à internet, réplique la voix de l'utilisateur, comme a pu le constater l'AFP lors d'une démonstration. « Vous ne pouvez pas le contrôler par du texte pour lui faire raconter ce que vous voulez », a toutefois précisé Neil Zeghidour. « Il ne peut traduire que quelque chose qui a vraiment été prononcé », a-t-il ajouté à l'heure où les images et enregistrements audio truqués grâce à l'intelligence artificielle pullulent sur internet, alimentant la désinformation.
Entraîné sur des données publiques, le modèle est disponible gratuitement en source ouverte, c'est-à-dire que son code est rendu public, afin que des chercheurs s'en saisissent ou encore des entrepreneurs qui souhaitent l'intégrer à des produits. « L'idée c'est d'avoir un modèle qui puisse être utilisé lorsqu'on voyage, lors de visioconférences ou encore en cas de streaming », Hibiki étant capable de fournir des sous-titres en direct, a détaillé Neil Zeghidour.
Le laboratoire, dirigé par Patrick Pérez, avait présenté en juillet un premier modèle appelé « Moshi », dont le code a été téléchargé des millions de fois. Moshi est une IA générative principalement vocale, c'est-à-dire que les utilisateurs interagissent avec elle uniquement en lui parlant, tandis que ses réponses se font à la fois à l'oral et à l'écrit.
Chaque jour à 13h, l’essentiel de l’actualité tech.

À lire également
Lancé en novembre 2023, le laboratoire à but non lucratif, qui compte une quinzaine de chercheurs, est financé à hauteur de 300 millions d'euros. « Notre objectif est de faire avancer le domaine de recherche en publiant nos découvertes », a développé Neil Zeghidour, ajoutant qu'un article scientifique accompagnait le lancement d'Hibiki.
(Avec AFP)
latribune.fr