GitHub : « L'intelligence artificielle va nous permettre de devenir un pilier de Microsoft » (Thomas Dohmke, directeur général)

ENTRETIEN. Fin octobre, Microsoft a annoncé que GitHub, sa filiale depuis 2018, avait dépassé la barre du milliard de dollars du chiffre d'affaires récurrent. Thomas Dohmke, le CEO de GitHub, explique à La Tribune comment GitHub va devenir l'un des piliers de Microsoft notamment grâce à l'intelligence artificielle. Les nouveaux produits de GitHub devraient permettre aux IA de suggérer environ 80% du code aux développeurs d'ici à cinq ans.
François Manens
Thomas Dohmke, CEO de GitHub, sur scène à l'occasion de la conférence annuelle de l'entreprise, la GitHub Universe.
Thomas Dohmke, CEO de GitHub, sur scène à l'occasion de la conférence annuelle de l'entreprise, la GitHub Universe. (Crédits : GitHub)

« Bonjour, je suis Thomas Dohmke, CEO de GitHub mais avant tout développeur de logiciels. » Voilà comment se présente invariablement Thomas Dohmke, que La Tribune a pu rencontrer à Paris. C'est en partie pour cet attachement à la qualification de développeur que ce quadragénaire originaire d'Allemagne de l'Est a été nommé à son poste de dirigeant fin 2021.

Déjà logiciel de référence de la communauté du logiciel open source [des logiciels publiés sous une licence libre qui permet à n'importe qui de les utiliser et de les modifier], GitHub ambitionne désormais de devenir « le lieu de vie des développeurs ». Elle-même bâtie sur la base d'un projet open source du nom de Git, l'entreprise permet concrètement aux développeurs d'héberger leur code informatique et de gérer les différentes versions de leurs projets.

Mais GitHub a connu un véritable tournant dans son histoire en 2018. Neuf ans après sa création, Microsoft a déboursé, à la surprise générale, 7,5 milliards de dollars pour l'acheter. Si l'entreprise n'a pas renié son cœur d'activité, elle ambitionne d'ouvrir un tout un nouveau marché autour de l'intelligence artificielle et de son nouveau produit phare, l'assistant d'aide à l'écriture de code Copilot. Explications avec Thomas Dohmke.

LA TRIBUNE - L'acquisition de GitHub par Microsoft en 2018 a choqué le monde du logiciel libre. Beaucoup trouvaient à l'époque ce mariage contre-nature. Comment ces accusations ont-elles été vues du côté de Microsoft ?

THOMAS DOHMKE - Microsoft a toujours été une entreprise de développement logiciel, c'est dans son ADN. Pendant ses 45 ans d'histoire, il a traversé plusieurs transformations, et l'une d'entre elles a été de s'ouvrir à l'open source. Microsoft est passé d'une vision presque négative de l'open source pour devenir un vrai soutien, en l'utilisant en interne et en y contribuant. L'entreprise a aujourd'hui un gigantesque programme d'open source, où des dizaines de milliers de ses développeurs contribuent. L'acquisition de GitHub en 2018 n'était donc qu'une étape supplémentaire, un engagement auprès de la communauté.

Les critiques avaient peur que Microsoft dénature GitHub, notamment par la recherche du profit. Qu'en est-il de l'autonomie de l'entreprise au sein du groupe aujourd'hui ?

Nous voulons que GitHub reste indépendant, et nous ne voulons pas qu'il devienne une chaîne de vente pour Microsoft. Si vous allez sur GitHub aujourd'hui, vous ne trouverez pas de logo ou d'identifiants Microsoft, et il n'y a pas de traitement de faveur pour Microsoft par rapport aux concurrents. Que vous déployiez sur Azure, Amazon Web Services ou Google Cloud, c'est la même chose pour GitHub. Quatre ans après l'acquisition, nous sommes toujours investis à 100% dans la position de neutralité de GitHub.

On imagine tout de même que faire partie de Microsoft apporte certains avantages...

Bien sûr, nous trouvons des synergies commerciales, puisque nous faisons partie d'une grande entreprise et qu'elle vend les produits de GitHub à des entreprises comme Société Générale, Engie ou Décathlon, entre autres clients français. Nous profitons des équipes de vente internationales de Microsoft, et nous nous appuyons sur les contrats déjà en place avec Microsoft. Souvent, quand on vend du logiciel d'entreprise, un des plus gros obstacles est de régler les détails du contrat entre les équipes juridiques des deux partis. Or, lorsque le contrat existe entre Microsoft et le client, c'est facile pour lui d'ajouter GitHub à la facture.

Nous trouvons aussi des synergies technologiques au sein du groupe. Copilot a par exemple été créé en partenariat avec Microsoft et Open AI. Nous avons utilisé un modèle de machine learning créé par Open AI, que nous avons fait tourné sur des GPU [des unités de traitement graphique, Ndlr] fournies par Microsoft Azure. Mais nous tâchons de développer ces synergies tout en maintenant notre indépendance et notre mentalité de startup.

Ces dernières années, la croissance de Microsoft, en particulier celle de ses bénéfices, est tiré par sa division cloud, Azure. Peut-on imaginer que GitHub endosse un rôle similaire dans le futur ?

Oui ! De la même façon que Windows, Office, LinkedIn et Azure, GitHub devient un pilier de Microsoft. Il existe des chevauchements entre ces activités -Azure tourne sous Windows, et Office tourne sur l'infrastructure d'Azure par exemple. GitHub s'intègre dans ces schémas, et peut jouer un grand rôle dans le futur de Microsoft.

Malgré l'acquisition à 7,5 milliards de dollars, GitHub reste relativement peu connu en dehors du milieu de l'informatique, et véhicule presque l'image d'une petite entreprise. Combien pèse-t-il dans le business de Microsoft ?

Je ne peux pas vous donner de chiffre d'affaires précis, mais il devient conséquent [peu après notre interview, Microsoft a annoncé que GitHub réalise 1 milliard de dollars de revenus récurrents, contre moins de 300 millions de dollars lors de l'acquisition, ndlr]. Il se reflète dans le fait que nous avons 3.000 employés, 94 millions de comptes de développeurs, et plus de 4 millions d'organisations clientes dont 90% des entreprises du Fortune 100. Nous avons beaucoup grossi depuis l'acquisition et nous continuons de croître. En 2018, nous avions 28 millions de comptes, et plus de trois fois plus aujourd'hui ! Nous avons rempli les attentes que Microsoft avait pour GitHub lors du rachat, et avec l'intelligence artificielle, nous pensons que nous arrivons à une nouvelle ère du développement logiciel, que nous espérons être celle de la prospérité.

Copilot, l'IA d'aide à la programmation que vous avez lancée en février 2022 après presque un an de tests, était votre premier pas dans cette nouvelle direction. Pourquoi misez-vous autant sur l'intelligence artificielle ?

Pour comprendre notre engouement, il faut retracer l'histoire du développement informatique. Il y a d'abord eu une première vague, des années 1980 jusqu'au début des années 1990, où l'apprentissage de la programmation informatique passait uniquement par les livres et les magazines. Vous deviez acheter des livres qui coûtaient cher, parce que les bibliothèques n'avaient que des références dépassées. Si vous étiez bloqués avec un problème, la seule façon d'avancer était de demander de l'aide à d'autres personnes, ce qui était difficile en dehors des grandes villes. A partir du milieu des années 1990, Internet a commencé à se développer et les forums sont apparus. Assez vite, il a été possible d'échanger facilement avec d'autres développeurs, et la collaboration s'est améliorée.

C'est la deuxième vague : Internet a démocratisé le développement logiciel, et le monde de l'open source est né. Vous pouvez partager votre code avec d'autres développeurs afin qu'ils puissent construire leur propre code par dessus. Cet écosystème permet aujourd'hui aux startups qui se lancent de ne pas commencer de zéro, mais d'avoir accès à des milliers de librairies open source. Résultat, c'est facile de construire une app aujourd'hui, grâce à de nombreux outils, dont GitHub.

Nous pensons que le développement informatique entre désormais dans une troisième vague, celle de l'intelligence artificielle. Au travers de programmes comme Copilot, qui aident les développeurs à écrire leur code source, les développeurs vont accéder à une  nouvelle manière d'exprimer leur créativité.

Qu'apporte concrètement Copilot ?

Parfois, nous -les développeurs- sommes bloqués dans l'écriture du code, parce que nous ne nous rappelons pas à quoi ressemble l'interface de programmation, ou comment se connecter à certains serveurs, ou encore comment décoder une image. Donc il faut chercher en ligne, et c'est ici que l'histoire se complique. On quitte son éditeur de code, où on était créatif, pour aller sur son navigateur, où 15 onglets sont ouverts avec sûrement une vidéo TikTok, un groupe de discussion avec la famille ou encore un site d'actualité, autant de sources de distraction.

Mais le pire, c'est qu'on est aussi distrait quand on va chercher la solution au problème sur GitHub, Google ou Stack Overflow, cette fois par d'autres développeurs qui débattent sur les forums ou dans les commentaires sur la meilleure solution à adopter. Et comme il n'y a souvent pas une solution unique, il faut prendre le temps de trouver ce qui correspond le mieux à son propre problème. Le résultat de cette situation, c'est que vous revenez dans votre éditeur 20 minutes plus tard, et vous avez complètement oublié ce sur quoi vous travaillez. Copilot évite en partie ces pertes de temps. Il suggère des morceaux de code, que le développeur choisit ou non d'accepter. S'il continue à écrire, le logiciel va ajuster sa proposition. Une fois que le développeur en est satisfait, il peut appuyer sur une touche pour l'insérer et le modifier à sa guise. Résultat, lorsque Copilot est actif, il écrit de 20% jusqu'à 40% du code selon les langages de programmation et les utilisateurs.

Le déploiement de Copilot a soulevé de nombreuses questions sur le respect des droits d'auteurs, puisque certains codes sont déposés aux registres de propriété intellectuelle. Comment adressez-vous ces inquiétudes ?

Une machine ne peut pas violer les droits d'auteurs, puisqu'elle n'est pas responsable devant la loi. Il faut garder à l'esprit que Copilot n'a pas de compréhension du langage, il ne fait que convertir ce que le développeur écrit en nombre, puis fait des calculs pour sortir un nouveau nombre, qui sera converti en proposition de code. Il ne fait qu'appliquer une méthode, il n'est pas intelligent et encore moins doué de sensations.

En revanche, c'est ce que fait l'utilisateur qui compte. Qu'il copie et colle un morceau de code qu'il a trouvé sur Internet ou que ce morceau ait été suggéré par une intelligence artificielle revient au même. C'est toujours la responsabilité du développeur de vérifier qu'il ne copie pas mot pour mot un code déposé par quelqu'un d'autre, et donc qu'il ne viole pas de licence de droit d'auteur.

L'écriture de code n'est que la première étape du cycle de vie du code, il doit ensuite faire l'objet d'une revue. Concrètement, le développeur envoie une requête aux membres de son équipe ou à l'équipe de maintenance du projet open source sur lequel il travaille, et ce sont ces autres personnes qui vont accepter le code dans la base principale. Elles vont regarder le code et le comparer à ce qui se fait. C'est une étape importante qui ne change pas avec l'assistant.

Cependant, nous sommes conscients du challenge qui se présente, et c'est pourquoi nous avons ajouté un réglage lors du lancement global de Copilot cette année. Si le développeur l'active manuellement (il est désactivé par défaut), Copilot ira comparer le code qu'il génère avec une base de code open source hébergé sur GitHub. Si l'extrait ressemble exactement -on parle d'un fragment significatif, qui embarquerait un certain niveau de créativité, pas une phrase simple qui serait trop courte- l'assistant ne proposera pas l'extrait. Le réglage doit empêcher les développeurs de copier accidentellement quelque chose créé par un autre développeur, et couvre donc une partie du risque.

Quelle place Copilot et les futurs outils nourris à l'IA vont-ils prendre dans le modèle de GitHub ?

C'est une catégorie de produits complètement nouvelle, même si elle est proche de la mission de GitHub qui est de mettre les développeurs dans les meilleures conditions. Mais Copilot nous écarte du cœur de notre business, qui est de devenir la maison de l'open source et du devops [l'articulation entre le développement et l'administration des systèmes, ndlr]. Nous créons désormais un produit qui vise à améliorer la productivité des développeurs. Depuis le lancement de la phase de test l'an dernier, plus d'un million de personnes ont enregistré un compte. Il y a clairement un marché.

Quelles sont les prochaines étapes ?

Nous prévoyons plusieurs avancées. Pour commencer, les modèles vont devenir de plus en plus puissants et donc précis. D'un côté, ils vont intégrer plus de paramètres grâce à la capacité de calcul des GPU qui s'améliore constamment. De l'autre, ils vont être entraînés sur un volume toujours plus large de code open source, dont une partie aura été créé grâce à Copilot. Un cercle vertueux s'installe.

L'autre axe de développement, c'est la couche d'expérience utilisateur. Copilot a du succès notamment parce que c'est une app ouverte qui s'intègre dans les environnements de développement, et non un programme séparé. Nous croyons qu'une nouvelle vague de produits va transformer l'interface de travail des développeurs. Si nous parvenons à répondre aux attentes, nous pensons que dans cinq ans, 80% du code sera issu de suggestions par des intelligences artificielles.

François Manens

Sujets les + lus

|

Sujets les + commentés

Commentaires 4
à écrit le 21/11/2022 à 19:07
Signaler
je redige mes codes tout seul, sans espion pour les revendre a d'autres gens......he pour l'AI si vous voulez des codes, vous prenez keras car vous ne comprenez rien a torch ou tensorflow, et tout de suite vous vous passez de l'aspirateur a idee...

à écrit le 21/11/2022 à 17:46
Signaler
L'intelligence artificielle va surtout permettre un contrôle total des populations en favorisant l'émergence des régimes autocratiques et la consolidation des dictatures.

à écrit le 21/11/2022 à 17:42
Signaler
On se demande bien où est l'intelligence du Copilot de Microsoft qui pratique le pillage en règle des dépôts publics/privés GitHub afin de suggérer du code (cf. profilage) au mépris du droit d'auteur au risque de provoquer un exode massif des entr...

à écrit le 21/11/2022 à 17:36
Signaler
Bref ! Moins on a d'intelligence, plus on la désire artificielle ! Peut-être pour trouver plus responsable que soi quand tout va mal ! ;-)

Votre email ne sera pas affiché publiquement.
Tous les champs sont obligatoires.

-

Merci pour votre commentaire. Il sera visible prochainement sous réserve de validation.