Première mondiale : une IA traduit un livre de 800 pages en 12 heures

 |   |  821  mots
L'Apprentissage Profond, version française de Deep learning, arrive en librairies le 18 octobre et s'impose comme le premier ouvrage entièrement traduit par une intelligence artificielle.
"L'Apprentissage Profond", version française de "Deep learning", arrive en librairies le 18 octobre et s'impose comme le premier ouvrage entièrement traduit par une intelligence artificielle. (Crédits : Quantmetry)
L'ouvrage de référence "Deep learning", livre de chevet d'Elon Musk et bible de tout ingénieur, chercheur, professeur ou étudiant en intelligence artificielle, sort en version française le 18 octobre. Pour une première mondiale, ses 800 pages ont été entièrement traduites en moins de douze heures par une intelligence artificielle construite par l'expert français Quantmetry avec la startup allemande DeepL.

Un livre sur l'intelligence artificielle, traduit par une intelligence artificielle : la boucle est bouclée. "Deep learning", l'ouvrage de référence sur l'apprentissage profond, "seul livre compréhensible sur le sujet" d'après Elon Musk, sort enfin en version française le 18 octobre. Sa particularité : il est le premier livre au monde à être entièrement traduit par une intelligence artificielle. Ce défi technologique - l'ouvrage comporte de nombreux termes techniques et formules mathématiques -, est le fruit d'une collaboration entre l'expert français Quantmetry et la startup allemande DeepL.

Première mondiale et performance technologique majeure

Écrit par trois pointures mondiales de l'IA (l'ancien employé de Google Brain Ian Goodfellow, les chercheurs Yoshua Bengio et Aaron Courville), "Deep learning", 800 pages, sorti aux États-Unis en 2016, est considéré comme la bible des étudiants, professeurs, chercheurs et ingénieurs spécialisés dans l'intelligence artificielle. S'il ne s'agit pas d'un ouvrage grand public, il fait tout de même partie des best-sellers des livres scientifiques (10.000 ventes en trois mois sur Amazon fin 2016). Il est non seulement une référence pour décrire l'état de l'art des concepts et des techniques d'apprentissage profond dans le monde, mais le livre est aussi considéré comme un support de choix pour nourrir le débat montant autour des implications sociétales, culturelles et économiques de l'intelligence artificielle, notamment autour de l'intelligibilité et de la puissance prédictive des algorithmes.

"Traduire un livre aussi technique que "Deep learning" ne représente pas le même niveau de difficulté que de traduire un roman, notamment pour les figures, les graphiques et les formules mathématiques", explique Jérémy Harroch, le fondateur et Pdg de Quantmetry, société de conseil spécialisée dans l'IA.

Pour résoudre cette difficulté, Quantmetry a fait appel à la startup allemande DeepL, qui a développé début 2018 un outil de traduction automatique basée sur l'apprentissage profond, considéré comme "le meilleur du marché" par Jérémy Harroch et Nicolas Bousquet, le directeur scientifique de Quantmetry. "Nous les avons associés pour créer un outil capable de traduire le langage informatique au format LateX, qui est le Word des articles scientifiques [prononcer "la tech", Ndlr]", précise Nicolas Bousquet.

Au total, deux mois et demi de travail ont été nécessaires pour créer l'outil, traduire le texte de 800 pages en moins de douze heures, puis effectuer des relectures humaines. Quatre correcteurs, des chercheurs issus de l'ENSAI, de l'INRIA et du CNRS y ont contribué.

"La traduction par l'IA, même à ce niveau d'excellence, nécessite toujours un petit travail de relecture humaine, pour effectuer des ajustements et quelques corrections. Mais 85% du texte est resté tel que traduit par l'IA. Les corrections ont donc été marginales", assure Jérémy Harroch.

Le gain de temps et d'argent par rapport à une traduction classique est spectaculaire, assure Quantmetry. "Pour traduire 'Deep learning' en français, il aurait fallu mobiliser une dizaine d'excellents spécialistes déjà très occupés, cela aurait pris au moins un an et aurait coûté très cher", explique Nicolas Bousquet, qui estime le gain de temps et d'argent à environ 80%. L'entreprise refuse d'indiquer le coût de sa traduction.

Positionner le français en tant que langue pour enseigner et penser l'IA

Édité par Quantmetry et les Éditions Massot, 'L'Apprentissage profond' pourrait se vendre, d'après les estimations de la maison d'édition, entre 2.000 et 3.000 exemplaires en France. Pour Quantmetry, qui "ne va pas gagner d'argent" sur cette opération, l'enjeu est surtout symbolique. La prouesse technique devrait contribuer à crédibiliser l'entreprise, qui compte une cinquantaine de clients grands groupes et 80 employés, comme un acteur majeur de l'IA en France.

Mais Jérémy Harroch et Nicolas Bousquet souhaitent également que cette traduction aide à "penser les sciences différemment", en affirmant le français comme une langue d'étude et d'analyse de l'IA.

"Tous les étudiants, chercheurs, entrepreneurs et ingénieurs spécialisés dans l'IA sont capables de lire un ouvrage en anglais, donc il n'y avait pas de réel besoin pour que 'Deep learning' trouve son public en France. Mais la traduction va grandement simplifier les choses pour les étudiants. De plus, populariser des termes de l'IA en français est important pour développer une pensée propre sur l'IA en France et défendre la francophonie dans l'enseignement des disciplines scientifiques", affirme Nicolas Bousquet.

--

Deep learning Quantmetry

[La couverture originale du livre]

--

Pour parfaire l'ouvrage, même sa couverture - une image de la Tour Eiffel, voir l'illustration de l'article -, a été "traduite". Fidèle à l'esprit de la couverture originale - une vue de Central Park à New York -, Quantmetry a choisi un lieu emblématique parisien et l'a soumis au même traitement que la photo originale : une transformation par des outils de transfert de style open source, notamment DeepDream Generator de Google.

Réagir

Votre email ne sera pas affiché publiquement
Tous les champs sont obligatoires

Commentaires
a écrit le 10/10/2018 à 14:59 :
"Nous les avons associés pour créer un outil capable de traduire le langage informatique au format LateX, qui est le Word des articles scientifiques [prononcer "la tech", Ndlr]", précise Nicolas Bousquet." Belle phrase, essayons de comprendre avec de lH, "traduire le langage informatique en LateX" Qu'est ce que cela veut dire? Le livre n'est pas écrit en langage informatique mais en Anglais, LateX est un langage de formatage de texte. Cela n'a pas grand sens. Sinon on a un convertisseur du format xxx vers LateX. Bof, cela existe déjà depuis longtemps. Aucune IA. "le Word des articles scientifiques " mouais, c'était, il y a toujours un certain snobisme à utiliser LateX qui, à l'époque (c'est pas hier) était le seul à permettre d'écrire des formules correctement, depuis il y a d'excellents éditeurs d'équation qui font 90% de ce que fait LateX sans se faire mal à la tête. Les non initiés vont continuer à se dire, wouah, on ne peut pas écrire du texte scientifique sans utiliser des trucs incompréhensibles...sont très forts... Enfin traduire un texte technique est beaucoup plus facile que de traduire un roman. Le texte scientifique est rempli d'expressions stéréotypées et emploie un langage relativement pauvre quasiment traduisible mot à mot, tout au contraire d'une texte littéraire qui peut déborder de constructions alambiquées et de vocabulaire subtil. Bref, c'est très bien pour le domaine scientifique mais ce ne sera qu'une aide pour traduire de la littérature. Ne pas imaginer que le bouquin rentre d'un côté et sorte tout traduit de l'autre.
a écrit le 09/10/2018 à 16:44 :
Le problème de cette prouesse technologique, c'est qu'ils connaissaient le livre à traduire à l'avance , ça lève quand même quelques difficultés...
Réponse de le 10/10/2018 à 15:00 :
'c'est qu'ils connaissaient le livre à traduire à l'avance', pourriez vous expliquer le sens de cette remarque? Par définition, on connait le livre que l'on demande de traduire.....
a écrit le 09/10/2018 à 15:26 :
C'est le début de la fin du métier de traducteur, donc. Peu importe la langue, cet outil fera le job.
a écrit le 09/10/2018 à 12:14 :
Amusant. J'ai fait un post il y a quelques mois pour expliquer les opportunités de l'IA à des vétérinaires anglais. J'avais expliqué à la fin avoir rédigé mon texte en français et l'avait traduit avec DeepL pour aller jusqu'au bout de la démonstration. https://www.vivet.org.uk/opportunities-changing-european-veterinary-sector/
a écrit le 09/10/2018 à 8:15 :
L’intelligence artificielle n'existe pas et n'est pas prête d'exister, et je suis le premier à l'attendre, ce titre est donc un mensonge. A trop chercher à vouloir être spectaculaire on y perd sa crédibilité.

Vous utilisez le langage marchand alors que comme le dit Machiavel" Le commerce est l'école de la tromperie."

Merci pour votre commentaire. Il sera visible prochainement sous réserve de validation.

 a le à :