Quand l’intelligence artificielle révolutionne la traduction automatique

L’éditeur Systran, dont les équipes de recherche sont installées en France, vient de lancer un moteur de traduction automatique fondé sur un « réseau neuronal » d’intelligence artificielle. Microsoft et Google sont aussi dans les starting-blocks. L’objectif ? Doter la machine de capacités de compréhension et de restitution digne de l’homme. Jusqu’à le remplacer ?
Sylvain Rolland

6 mn

Systran s'est bien placé dans la course au marché des entreprises, mais ses concurrents sont également dans les starting blocks, notamment SDL, ainsi que Google et Microsoft. Les deux géants du net américains ont aussi annoncé cet automne le lancement de moteurs neuronaux pour la traduction.
Systran s'est bien placé dans la course au marché des entreprises, mais ses concurrents sont également dans les starting blocks, notamment SDL, ainsi que Google et Microsoft. Les deux géants du net américains ont aussi annoncé cet automne le lancement de moteurs neuronaux pour la traduction. (Crédits : © Regis Duvignau / Reuters)

La machine va-t-elle rattraper puis dépasser l'homme dans tous les domaines, même ceux qui exigent des qualités poussées de compréhension, de contextualisation, d'anticipation, de finesse, bref, des caractéristiques profondément humaines ? Au début de l'année, le meilleur joueur de go au monde a été battu à la loyale par une intelligence artificielle de Google. L'exploit paraissait pourtant impossible, mais la machine, dopée à l'intelligence artificielle, au deep learning (apprentissage en profondeur) et enrichie par le big data (analyse des données à grande échelle) a prouvé qu'elle pouvait anticiper le jeu et faire preuve de créativité dans les coups, jusqu'à battre le champion du monde.

L'intelligence artificielle va bouleverser la traduction

Quid de la traduction ? Jusqu'à présent, les traducteurs n'étaient pas trop inquiets pour leur avenir. Car malgré les progrès des logiciels, il était impossible pour une machine de restituer de manière convaincante toutes les subtilités de la langue, du second degré aux jeux de mot, en passant par les multiples expressions intraduisibles par du mot-à-mot. Sans même parler du langage technique et hyperspécialisé, comme dans le droit, l'informatique ou les contrats.

Cela va changer. Comme pour le jeu de go, l'intelligence artificielle progresse à vitesse folle. Si bien que plusieurs entreprises (Google, Microsoft, Systran) ont lancé cet automne, quasi-simultanément, des logiciels de traduction automatique d'une qualité inégalée. Leur secret ? Le NMT, pour Neural Machine Translation. Cet acronyme désigne une intelligence artificielle « neuronale », proche du fonctionnement d'un cerveau humain. Ce qui lui permet d'embrasser la complexité de la langue et de restituer du chinois, par exemple, mieux qu'une personne non-native. Et, à terme, mieux qu'un Chinois lui-même.

Systran lance sa solution de traduction neuronale pour les entreprises

Spécialiste de la traduction automatique depuis quarante ans, l'entreprise sud-coréenne Systran, dont la R&D est basée en France, vient de lancer son propre moteur neuronal, baptisé Pure Neural MT, que l'entreprise revendique comme « le plus abouti du marché ». Disponible en trente langues, sa solution, permet de « traiter la phrase, le paragraphe ou le document dans sa globalité », grâce à un réseau de neurones artificiels unique au monde.

Ce réseau comprend 3.000 lignes de codes, soit davantage, d'après l'entreprise, que celui de Google Translate. Comme dans un cerveau humain, Systran a mis au point des sous-réseaux de neurones, qui sont complémentaires, interconnectés et s'activent au fur et à mesure de l'avancée de la traduction. Ainsi, un premier sous-réseau va traiter la phrase pour en extraire le sens. Un second, spécialisé dans la syntaxe et la sémantique, va enrichir la compréhension. Un troisième va contextualiser le contenu. Un quatrième va attirer l'attention sur les mots-clés... Et ainsi de suite.

« Tous ces sous-réseaux nourrissent le moteur et vont lui permettre de choisir la meilleure traduction possible », explique Jean Senellart, le président de Systran.

Remplacer la traduction "statistique" popularisée par Google

L'entreprise considère son réseau neuronal comme « une innovation radicale », destinée à « remplacer toutes les technologies de traduction existantes ». Effectivement, cette technologie va plus loin que la traduction « statistique » perfectionnée par Google, qui donne des résultats parfois très approximatifs, voire ridicules, avec moult contresens et mauvaise concordance des temps. Car ces anciennes générations de moteurs se basent sur le big data, ou l'analyse d'un énorme volume de données en temps réel, pour repérer les phrases qui reviennent le plus souvent et traduire automatiquement de manière extrêmement rapide.

Au contraire, le réseau de Systran se nourrit de données enrichies, comme l'explique Jean Sennelart:

« Notre moteur s'adapte et s'auto-spécialise. Il comprend les bases d'une langue et s'ajuste au plus près de la terminologie et du métier de ses clients en apprenant en continu sur la base des données qui lui sont confiées. Le chinois de l'informatique, le chinois de juridique et le chinois médical sont presque des langues différentes, mais le moteur va s'y adapter très vite ».

Systran cible uniquement les entreprises. Les grands groupes mondiaux représentent 30% de son chiffre d'affaires. Des firmes comme PSA, Adobe ou Société générale l'utilisent pour traduire leurs contrats et documents internes dans leurs multiples filiales. L'entreprise équipe aussi des sociétés de traduction, qui utilisent sa technologie pour leurs clients.

A la différence de Google, qui se considère propriétaire du texte qu'il traduit, Systran commercialise ses solutions sur la base d'abonnements et permet à l'entreprise d'héberger elle-même le logiciel, ce qui lui donne un avantage compétitif. De fait, Systran travaille avec des sociétés dans la défense, la sécurité et même des services secrets. « Les données clients, les contrats ne peuvent pas être dans le cloud, nous les hébergeons dans nos propres datacenters, explique Cédric Rouvrais, le directeur de l'équipe d'innovation à la direction des services informatiques de la Société générale. Par conséquent, il nous fallait un logiciel de traduction installé en interne, car les données sont trop sensibles »,

Google et Microsoft se convertissent aussi au neuronal

Si Systran s'est bien placé dans la course au marché des entreprises, ses concurrents sont également dans les starting blocks, notamment SDL, mais aussi Google et Microsoft. Les deux géants du net américains ont aussi annoncé cet automne le lancement de moteurs neuronaux pour la traduction.

Révélé en novembre, Google Neural Machine Translation (GNMT) s'attaque, grâce aux réseaux neuronaux d'intelligence artificielle, aux fameuses erreurs et approximations qui font la renommée de Google Translate. Avec ce nouveau système, intégré à l'ancien, Google annonce réduire les erreurs de traduction jusqu'à 85%. Si Google Translate est disponible dans 103 langues, seules neuf ont été adaptées à la technologie GNMT, dont le français et l'anglais, mais aussi le chinois, le coréen, le japonais, le turc, l'espagnol, l'allemand et le portugais. De quoi améliorer une bonne partie des recherches mondiales.

C'est également en novembre que Microsoft a lui lancé son moteur neuronal pour ses traductions automatiques via Skype Translator et Microsoft Translator. Disponible en soixante langues, le système vise à faciliter les conversations groupées. Jusqu'à 100 personnes peuvent converser en même temps en utilisant le logiciel. De quoi séduire les entreprises qui doivent organiser des réunions entre filiales à l'autre bout du monde.

Sylvain Rolland

6 mn

Sujets les + lus

|

Sujets les + commentés

Commentaires 8
à écrit le 24/12/2016 à 10:49
Signaler
Franchement ça n'a rien de bon, encore un truc qui va faire baisser le revenu, les compétences et faire disparaitre des professions. En tant que comptable, en 2008 parler anglais, permettait de toucher 20% de plus en salaire dans la plupart des bo...

à écrit le 23/12/2016 à 14:50
Signaler
L'utilisation de réseaux neuronal en hardware existe depuis plus de 30 ans, en particulier pour la reconnaissance vocale ou la reconnaissance faciale. Associé aux processus de Markov, cela concerne la traduction vocale simultanée déjà avancée depuis ...

à écrit le 22/12/2016 à 21:36
Signaler
Beaucoup d’eau va encore passer sous les ponts avant que la machine remplace l'Homme dans le domaine de la traduction/communication. Jusqu'à présent, les pros utilisent des mémoires de traduction, à savoir que le logiciel ne traduit rien, mais se sou...

à écrit le 22/12/2016 à 16:53
Signaler
...entreprise sud-coréenne Systran, dont la R&D est basée en France,... Sans commentaire

le 22/12/2016 à 20:15
Signaler
Et alors ? Si une entreprise étrangère installe sa R&D en France, n'est-ce pas une bonne chose ? Mieux vaut qu'elle l'installe ici plutôt qu'ailleurs non ? Systran n'a jamais été une entreprise française.

à écrit le 22/12/2016 à 13:50
Signaler
Au vu de ce qui est dit dans l'article, Systran a l'air de s'appuyer sur des couches logicielles plutôt que sur un véritable "réseau neuronal". L'air de rien, Google translate est de plus en plus pertinent au niveau des traductions, parceque Google ...

à écrit le 22/12/2016 à 13:12
Signaler
Il y a du travail car pour le moment les traductions automatiques sont la plupart du temps incompréhensible !

à écrit le 22/12/2016 à 10:53
Signaler
IL est évident que le milieu de décideurs privés gangréné par l'incompétence et la bêtise a besoin d'une "intelligence artificielle", où plutôt d'une programmation affinée puisque l'IA n'existe pas encore, particulièrement solide. Puisqu'ils veulent ...

Votre email ne sera pas affiché publiquement.
Tous les champs sont obligatoires.

-

Merci pour votre commentaire. Il sera visible prochainement sous réserve de validation.