Alexis Conneau, la « voix » de ChatGPT, à la conquête de l'IA émotionnelle
Marine Protais
Ce contenu est réservé aux abonnés La Tribune
L'ingénieur français Alexis Conneau, à l'origine de la voix de ChatGPT, lève 40 millions de dollars pour développer une « intelligence émotionnelle générale ».
Avec seulement cinq employés et des ambitions immenses, WaveForms AI lève 40 millions de dollars auprès du prestigieux fonds américain Andreessen Horowitz. Fondée par l'ingénieur français à l'origine de la voix de ChatGPT, Alexis Conneau, la start-up vise à créer une « intelligence émotionnelle générale ».
Voici un nouveau venu dans l'arène de l'intelligence artificielle. WaveForms AI, une jeune entreprise fondée par Alexis Conneau, ancien d'OpenAI, et Coralie Lemaitre, ex de Google, annonce ce lundi une première levée de fonds de 40 millions de dollars auprès du fonds emblématique de la Silicon Valley, a16z, géré par Marc Andreessen and Ben Horowitz.
L'opération valorise déjà à hauteur de 200 millions de dollars cette start-up composée de seulement cinq personnes. Il faut dire que son projet est attrayant aux yeux de la Silicon Valley : WaveForms AI veut rendre nos interactions avec les intelligences artificielles aussi naturelles et émotionnelles que celles entre humains.
Alexis Conneau, la « voix » de ChatGPT
Si la jeune entreprise réunit un tel montant, c'est grâce au pedigree de l'équipe dirigeante. Alexis Conneau est l'ingénieur français qui a doté ChatGPT d'une voix. Durant ses années chez OpenAI, le trentenaire était chargé du développement de l'« Advanced Voice Mode » de GPT-4o.
Cette fonctionnalité, présentée en mai dernier, avait impressionné les utilisateurs par la fluidité d'interaction qu'elle permettait avec une IA, très loin de nos étranges froids avec Siri et Alexa. Contrairement aux précédentes technologies, le modèle audio d'OpenAI fonctionne de manière « end-to-end ». Cela signifie qu'il traite la voix dans un flux unique, sans étapes intermédiaires comme la reconnaissance vocale ou la transcription.
Résultat : des temps de réponse extrêmement courts et une fluidité inédite. D'autres acteurs ont réussi cela, à l'instar du laboratoire français Kyutai et de son IA vocale Moshi. Mais l'innovation majeure d'OpenAI réside, selon Alexis Conneau, dans le développement d'une « intelligence audio », c'est-à-dire un modèle capable d'adapter ses réponses aux fluctuations émotionnelles des utilisateurs, sans apprentissage préalable spécifique.
Newsletter
Tech & IA
Chaque jour à 13h, l’essentiel de l’actualité tech.