La start-up Probabl, issue des laboratoires de l’Inria et pilote de scikit-learn, la bibliothèque de machine learning la plus utilisée au monde, boucle une levée de fonds pour transformer la science des données artisanale en un moteur de performance pour les entreprises.L’écosystème français de l’intelligence artificielle se dote d’un nouvel acteur de poids. Probabl, entreprise à mission issue de la recherche publique, annonce ce 16 septembre une levée de fonds de 13 millions d’euros. Ce tour de table, mené conjointement par Serena et Capital Fund Management (CFM) avec le soutien de Mozilla Ventures et de French Tech Souveraineté via Bpifrance, porte son financement total à 18,5 millions d’euros, signant ainsi la plus importante levée d’amorçage pour un logiciel open source commercial en Europe, d’après l’entreprise.
Issue des laboratoires de l’Inria (Institut national de recherche en sciences et technologies du numérique), la jeune pousse s’appuie sur une solide expérience comme éditrice d’une bibliothèque d’algorithmes peu connue du grand public, mais incontournable pour la programmation, scikit-learn. Ce catalogue est aujourd’hui un standard mondial, avec plus de 1,5 milliard de téléchargements. Il est largement utilisé par des multinationales, des banques du CAC 40 jusqu’aux géants américains du numérique tels que Netflix.
Sortir des laboratoires, le défi de la start-up
Contrairement à l’IA générative, scikit-learn évolue sur un terrain bien différent. « Les modèles de langage traitent majoritairement de texte pour répondre à leurs demandes, tandis que de notre côté, nous travaillons sur des données plus mathématiques, quantitatives, tabulaires », précise Yann Lechelle, PDG de Probabl et entrepreneur.
L’expertise des chercheurs n’étant plus à démontrer, la jeune entreprise s’attache désormais à exploiter pleinement ces compétences. Yann Lechelle, se décrit lui-même comme la « pièce rapportée », chargé par l’Inria de « sortir cette technologie du laboratoire ». « On estime que 87 % du travail réalisé en science des données n’est jamais mis en production, explique-t-il. Les équipes de recherche, dans les entreprises, explorent, expérimentent, mais leur travail reste souvent artisanal, non reproductible ».