X IA, un dynamisme polytechnicien à la pointe de l’IA
Fondé en 2018, le groupe X IA est fort de 1 100 membres actifs et impliqués dans des thématiques d’intelligence artificielle, qui ont connu un gain d’intérêt majeur en 2023 avec l’émergence notable de ChatGPT. Boosté par cette importance accrue de l’IA dans les entreprises et dans l’innovation, le groupe X IA attire toujours plus de jeunes polytechniciens et d’acteurs de premier plan de l’IA et souhaite doubler en 2024 sa force de frappe événementielle, pour répondre aux besoins croissants de la communauté polytechnicienne dans ce secteur en ébullition constante.
Interview de Sophie Monnier (X09) présidente du groupe X IA
Quel est le bilan du groupe X IA depuis sa création ?
On ne s’attendait pas à un tel engouement quand on a créé le groupe en 2018 avec Jérémy Harroch (X03) et quelques-uns de chez Quantmetry. 2018 était une année charnière pour l’IA, avec des POC (proof of concept), des démonstrations de valeur presque universitaires, mais peu de déploiements en production qui aient un vrai ROI quantifié pour les entreprises. Le commencement de la maturation des déploiements en production, c’était en 2019. Quand X IA a été créé en 2018, nous avons constaté que beaucoup de polytechniciens travaillaient dans le domaine de l’IA à des postes intéressants dans le domaine universitaire, dans les cabinets de conseil, dans les grandes entreprises, et dans les licornes. X IA était un moyen de les atteindre et de les fédérer.
En 2023, X IA a vraiment décollé au moment où l’IA générative (GenAI) a mis les projecteurs sur l’IA, et pas seulement pour les gens qui y travaillent, mais pour tous les gens qui s’y intéressent et qui ont senti qu’il fallait monter à la vitesse supérieure. Nous sommes ainsi passés de 800 à 1 100 membres.
Pendant l’année, nous avons organisé quatre événements avec beaucoup de listes d’attente sur des sujets à la fois théoriques et pratiques : privacy ; un sujet research to prod, comment est-ce qu’on passe de la recherche et des POC à la production avec Deezer et InstaDeep ; un sujet sur l’état de l’art de l’IA générative avec Mistral AI et Photoroom ; et le sujet IA générative sous l’angle des retex de personnes qui ont mis en production des LLM (large language models), les choix techniques qu’ils ont faits, et concrètement pourquoi ils n’ont pas retenu ChatGPT ou GPT‑4 comme solution (coûts, latence).
Quelles sont les motivations des polytechniciens pour rejoindre le groupe ? Est-ce un besoin professionnel, un centre d’intérêt ?
On distingue trois types de membres. Tout d’abord, beaucoup de jeunes qui ont rejoint le groupe parce qu’ils veulent travailler dans l’IA. C’est une technologie qui arrive au moment où ils sont encore en train de faire leurs études ou leur thèse, ils veulent bénéficier d’une approche assez large de ce qui se passe pour mieux se positionner.
Plus de 30 % de nos membres sont étudiants ou ont moins de cinq ans d’expérience professionnelle. Je crois que c’est une singularité du groupe X IA par rapport à d’autres groupes X. Puis viennent ceux qui se retrouvent dans des entreprises qui ne sont pas AI native. Il y a eu comme un effet FOMO (Fear of missing out) dans les entreprises à propos de la GenAI. Comme il est très difficile de suivre l’actualité colossale de l’IA depuis 2023 avec un papier diffusé presque toutes les dix minutes, X IA permet de suivre les grandes tendances avec des intervenants au centre de l’état de l’art du domaine.
“Plus de 30 % des membres d’X IA sont étudiants ou ont moins de cinq ans d’expérience professionnelle, une singularité par rapport à d’autres groupes X.”
Et il y a une troisième catégorie de personnes. Ce sont des pionniers sur cette technologie comme InstaDeep où je travaille, qui est une entreprise AI native ; des personnes qui travaillent chez Meta, dans des start-up GenAI comme Jimini dont le CTO est membre du bureau d’X IA. Ces personnes veulent se maintenir à la pointe pour découvrir les nouveaux papiers ou échanger sur ce qu’ils font dans leur entreprise, avec d’autres X ou d’autres acteurs du secteur.
En tant que présidente du groupe X IA, comment choisis-tu les sujets ?
C’est un peu un challenge impossible parce que nous avons un rythme de quatre éditions par an. Nous veillons à équilibrer entre ce qui est du ressort de l’innovation tendance, qui va beaucoup attirer comme la GenAI et Mistral AI, et des problématiques qui paraissent moins attirantes mais pour lesquelles la valeur métier est beaucoup mieux identifiée et avec des technologies plus matures : maintenance prédictive, prévision des ventes, supply chain.
Pour ce faire, je fais de la veille sur LinkedIn, sur Twitter. InstaDeep a beaucoup de canaux internes de veille technologique par lesquels je me tiens au courant. Je suis abonnée à quatre ou cinq newsletters à plusieurs niveaux de technicité ; j’écoute régulièrement plusieurs podcasts pour avoir une idée des intervenants et des thèmes pertinents ; et j’ai la chance d’avoir l’aide du bureau d’X IA, d’une dizaine de membres très impliqués de promos allant de la X80 à la X19, qui travaillent dans des verticales très différentes (explicabilité, GenAI, légal, art, thèses de médecine). Et depuis 2023 nous commençons à avoir des demandes d’entreprise pour présenter leurs sujets à X IA. Pour un intervenant sélectionné, on en interviewe trois ou quatre. La sélection n’est donc pas garantie !
Quel est l’intérêt pour ces entreprises de faire ces présentations ?
Les deux centres d’intérêt qui sont évidents sont d’une part la visibilité de leur entreprise auprès d’un public extrêmement qualifié techniquement ; et d’autre part le recrutement de jeunes talents qui seront peut-être les stars de demain ou de personnes très qualifiées en IA.
Dans la sélection des 125 start-up sur six verticales stratégiques du programme French Tech 2030 annoncé par Emmanuel Macron à Viva Tech 2023, dans 45 % des entreprises on trouve des polytechniciens souvent à des postes de cadre supérieur.
Ils sont très actifs dans la sphère IA, pour la souveraineté française, dans les plus grandes entreprises mondiales où ils sont pionniers de l’IA comme chez Hugging Face où Julien Chaumond (X03) et Thomas Wolf (X03) sont cofondateurs respectivement CTO et CSO ; beaucoup travaillent ou ont travaillé chez Meta, dont les deux X11 Arthur Mensch et Guillaume Lample qui ont fondé Mistral AI. Il y a plus de demandes que d’offres pour ces présentations.
Comment abordez-vous 2024 ? Quels sont vos sujets ?
Le changement le plus important réside dans le fait que le groupe X IA devient en 2024 une association loi de 1901, ce qui nous permettra de fonctionner sur un modèle de sponsoring tout en maintenant nos événements gratuits. Chercher un hébergeur pour nos événements nous prenait trop de temps et les salles étaient souvent trop petites pour accueillir les participants. Le but est ainsi d’avoir accès à des salles plus grandes de manière récurrente, pour permettre à davantage de personnes d’y participer, et de passer de quatre à huit éditions.
Nous venons de boucler un tour de sponsoring. Sur la partie fonctionnelle nous souhaitons créer des verticales d’X IA ; nous testons en 2024 une verticale santé avec le projet d’organiser quatre éditions dédiées sur le sujet et quatre éditions sur les autres sujets. Si cela fonctionne bien, on peut imaginer d’autres verticales ciblées. Et, si tout se passe bien, on veut aussi se donner les moyens de tester d’autres formats, des sessions de questions-réponses avec un seul intervenant de manière informelle, en plus petit comité.
Actuellement, que perçois-tu comme grandes tendances dans l’IA ?
Il y a ce que je vois de manière générale et il y a mon prisme InstaDeep. Chez InstaDeep, j’ai un fort prisme vers le reinforcement learning et les LLM appliqués à la biologie. D’autre part, je garde un contact fort avec le reste de l’écosystème parce que, ayant travaillé pour Quantmetry et d’autres entreprises, beaucoup d’autres thématiques machine learning au-delà de la GenAI sont intéressantes. La GenAI est en effet le sujet du moment, comme le montre le State of AI Report de 2023, qui indique que la GenAI a représenté 18 milliards de dollars d’investissements sur les 22 milliards investis en IA au global, ce qui a boosté l’investissement dans une période post-Covid et géopolitique assez incertaine.
On a assisté à des valorisations astronomiques d’entreprises qui n’existaient pas il y a un an comme Mistral AI, l’exemple français le plus emblématique qui, après six mois d’existence, a été valorisé à près de 2 milliards de dollars et a levé 450 millions de dollars (385 millions d’euros) ; AWS a investi 4 milliards de dollars dans Anthropic, une entreprise fondée par des anciens d’OpenAI spécialisée sur l’alignement des LLM ; Inflection AI qui veut développer l’intelligence artificielle générale (IAG, système hautement autonome capable de surpasser l’humain dans la plupart des tâches ayant un intérêt économique) a levé plus d’un milliard de dollars en 2023.
“Nous sommes dans un contexte complètement fou de bulle avec un développement et une adoption de technologies extrêmement rapides.”
Nous sommes dans un contexte complètement fou de bulle avec un développement et une adoption de technologies extrêmement rapides, deux exemples étant ChatGPT et LangChain qui facilitent le développement d’applications à partir de LLM. Ces projets ont à peine un an et, aujourd’hui, il est devenu difficile de s’en passer pour créer un prototype de projet GenAI. En 2024 ce qui va être intéressant, c’est de voir au-delà de la bulle qui sont les gagnants et les perdants.
Je pense qu’on va voir deux types de comportements. D’une part des entreprises qui vont complètement assumer cette maturation et cette adoption de la GenAI et qui vont se développer. Et des entreprises qui ne vont pas y arriver pour plusieurs raisons, notamment des start-up. Un des problèmes est le suivant : quel positionnement business prendre, sachant qu’une nouvelle start-up compétitrice se lance presque tous les jours ; ou bien quand OpenAI ou des Gafam sortent une nouvelle fonction qui est exactement celle que je voulais développer avec mon entreprise ; ou une entreprise plus mature comme LightOn qui pivote sur le développement de plateformes end-to-end pour entraîner et déployer des LLM. Très vite, des start-up peuvent se retrouver sans business model et doivent pivoter extrêmement vite pour survivre.
À côté de ces sujets, j’ai un prisme reinforcement learning (RL).
Peux-tu préciser ce qu’est le reinforcement learning ?
Le reinforcement learning, ou apprentissage par renforcement, est un paradigme qui permet de faire interagir un agent dans un certain environnement qui est un jumeau numérique de la réalité. Cet agent peut prendre un certain nombre d’actions prédéfinies. En interagissant avec son environnement, l’agent va recevoir des récompenses ou des pénalités qui vont lui faire apprendre une stratégie optimale à adopter pour atteindre le maximum de sa récompense à long terme. Cette stratégie – ou policy en anglais – peut être modélisée par un réseau de neurones. Dans ce cas on parle de deep reinforcement learning. Le Deep RL a été beaucoup popularisé par DeepMind, pour notamment battre les humains au jeu de go, aux jeux vidéo type Atari ou StarCraft. InstaDeep utilise le reinforcement learning pour un grand nombre de projets industriels dans le monde réel, au-delà de l’univers des jeux.
Mais le RL a beaucoup fait parler de lui en 2023 pour une autre raison : le reinforcement learning from human feedback (RLHF), car c’est ce qui a permis à des modèles fondationnels de base comme GPT de devenir des chatbots comme ChatGPT pouvant interagir avec des utilisateurs, par exemple dans un contexte de questions-réponses. Le LLM à l’origine est un modèle qui va prédire le mot le plus probable après un certain mot. Mais il n’est pas pour autant capable de répondre à des questions ni de varier le ton de sa réponse (expert, débutant, ami…). L’entraînement du LLM doit passer par une phase d’instruction appelée fine-tuning, puis par une boucle de RLHF. On parle maintenant de plus en plus de RLAIF, reinforcement learning by artificial intelligence feedback, car le choix des préférences de réponse du LLM se fait par un LLM comme GPT‑4 au lieu d’humains.
Un troisième point d’actualité qui m’est propre via InstaDeep, c’est la biologie. La santé IA en France a déjà un riche passé avec des start-up comme Owkin, Aqemia, Iktos, Therapixel, Gleamer, Volta Medical, Cardiologs, toutes fondées par des polytechniciens et étant passées par X IA il y a quelques années. Avec la GenAI, on comprend qu’on peut appliquer des modèles de langage non seulement sur du texte mais aussi sur tout type de séquence et même des séquences biologiques, comme les protéines, qui sont des séquences d’acides aminés, sur l’ADN et l’ARN constitués de séquences de nucléotides. Pourquoi est-ce qu’on ne pourrait pas entraîner des modèles à apprendre des représentations sous-jacentes du langage de la vie et à faire des prédictions quant à ces représentations ?
Quelles en seraient les applications ?
Pendant la pandémie, InstaDeep a travaillé à prédire la dangerosité des variants de la Covid en prédisant l’éloignement de leur séquence d’origine par rapport à la souche d’origine, le wild type (type naturel ou type sauvage, la forme naturelle, ou de référence, d’un organisme, d’un génome, d’un gène ou encore d’une protéine). InstaDeep a travaillé avec BioNTech, a mis son travail à disposition de l’Organisation mondiale de la santé et a permis de gagner deux mois d’avance sur la prédiction des nouveaux variants dangereux, en vue d’adapter les nouveaux vaccins. Ce travail de Early Warning System (EWS) a par la suite été publié dans des revues scientifiques.
Peux-tu nous en dire plus sur toi et sur ton parcours ? De quand date ton intérêt pour l’IA ?
Ça peut paraître bizarre, mais quand j’étais petite j’adorais observer les catastrophes naturelles. Mes films préférés : Twister qui mettait en scène une chasseuse de tornades ; Volcano, avec une femme volcanologue ; j’adorais Stargate SG‑1, la série avec des militaires qui vont explorer des planètes, parmi lesquels il y a une femme qui est la scientifique du groupe. Je voulais être cette personne-là, la femme scientifique dans des milieux très masculins, qui est le cerveau du groupe [rires]. Quand je suis arrivée à Polytechnique dans la promo 2009, il n’y avait pas de cours d’IA.
L’IA a commencé à percer en 2012, avec la performance de certains modèles de computer vision dans une grande compétition internationale qui s’appelle ImageNet. Je crois que les cours de data science ont commencé en 2014 à Télécom, et ensuite à Polytechnique. Après l’X j’ai fait ma 4A à l’Institut de physique du globe de Paris (IPGP) pour travailler la géophysique, la physique et la simulation numérique appliquées aux sciences de la Terre. J’ai fait ma thèse en géophysique sur la prédiction des risques sismiques sur le continent australien de 2015 à 2017, ce qui est assez éloigné de l’IA.
Au même moment, je voyais qu’en France la data science était en pleine effervescence et que beaucoup de polytechniciens travaillaient dans le domaine. Comme je n’étais pas trop inspirée par l’idée de travailler pour les groupes pétroliers, ce à quoi me destinait assez naturellement ma thèse de géophysique, j’ai suivi tous les cours en ligne qui existaient sur l’IA à cette époque.
“Après ma thèse de géophysique, j’ai suivi tous les cours en ligne qui existaient sur l’IA.”
De retour en France, j’ai pris contact avec les alumni. Je dois beaucoup au réseau polytechnicien qui m’a aidée à gérer cette transition. J’ai contacté une quarantaine de personnes en trois mois et tout le monde m’a répondu ! J’ai choisi Quantmetry parmi d’autres propositions, parce que je souhaitais aborder une grande diversité de sujets, pour découvrir au fil de l’eau ce que je préférais. J’ai passé deux très belles années chez Quantmetry, où j’ai travaillé sur des problématiques de télécommunications avec des graphes de prédiction de risques de pollution, sur des problématiques d’assurance, sur des problématiques médicales, dans l’alimentaire, sur des projets plus ou moins matures : POC, industrialisation, les deux parfois, stratégie. C’était une expérience très riche. C’est pendant cette période qu’X IA a vu le jour.
Ensuite j’ai continué à travailler dans le machine learning, mais dans des environnements plus start-up, avec un statut de freelance car je voulais créer le projet dès son début. J’ai ainsi travaillé dans des entreprises d’immobilier sur des cas d’usage variés (recommandation de biens immobiliers, prédiction de prix), dans une start-up de santé orientée vers le sport où la computer vision permettait de suivre via la vidéo les mouvements des personnes qui font du sport à domicile pour analyser leurs postures, tout ça dans un contexte de Covid, pour leur éviter de se blesser, etc. Et ensuite j’ai rejoint InstaDeep. Ça fait six ans maintenant que je me suis « reconvertie » dans l’IA.
Quel est ton poste chez InstaDeep ? Comment évolue ta carrière dans l’IA ?
C’est un rôle très intéressant pour moi, de transition entre la technique et le business. C’est-à-dire que tous les postes que j’ai eus auparavant, chez Quantmetry, dans les start-up ou chez Zephyr où j’étais avant d’arriver chez InstaDeep, étaient des postes de data scientist, senior data scientist, tech lead, donc de développeur sur les projets et l’implémentation du modèle ou la mise en production. Chez InstaDeep, c’est un rôle plus hybride de business development engineer, avec une perspective business beaucoup plus importante.
C’est très intéressant pour moi d’avoir une composante technique, une bonne compréhension des modèles qu’on va développer en aval et cette dimension business. De plus, comme InstaDeep est une entreprise très deeptech et très orientée R & D, l’aspect de recherche y est très important, ce que j’apprécie et qui me permet de continuer à lire beaucoup de papiers. Le tout dans une entreprise en forte croissance et bien positionnée dans cet écosystème AI et GenAI.
Peux-tu nous faire partager une de tes meilleures expériences professionnelles, une expérience qui t’a vraiment fait vibrer ?
Il y en a deux, mais elles ont des choses en commun. La première expérience, c’était ma première mission chez Quantmetry pour un acteur de télécommunications, qui a duré à peu près un an. Ce que j’ai vraiment aimé chez Quantmetry en général, et dans cette mission-là en particulier, a été de travailler avec des gens « bien câblés », curieux, efficaces, desquels j’ai énormément appris dans une ambiance d’émulation extrêmement positive. Certains sont devenus des amis proches et nous le sommes restés même après Quantmetry.
Chez InstaDeep, la seconde, au-delà du fait de travailler sur les LLM, j’apprécie l’esprit assez pionnier de l’entreprise et je retrouve aussi cette ambiance d’émulation et d’inspiration. J’aime mettre InstaDeep en relation avec la communauté IA et celle que j’anime, X IA. Identifier les gens à l’esprit vif et curieux et les mettre en relation pour créer des collaborations intéressantes, c’est quelque chose que j’aime particulièrement faire. Ce qui me plaît le plus aujourd’hui dans mon travail, c’est le fait de conjuguer l’aspect technique et l’aspect humain que je retrouve chez InstaDeep, double aspect qui me manquait auparavant quand j’avais des postes 100 % techniques.
Y a‑t-il une réalisation qui te soit attribuable personnellement, qui te rende fière de toi ?
Ce dont je suis très fière, c’est du groupe X IA, le fait d’avoir participé à la création d’un groupe si jeune, avec aujourd’hui 1 100 membres très actifs et impliqués sur du temps personnel. J’en ai repris la présidence en 2020 ; j’ai un bureau très solide, très investi, et des éditions qui à chaque fois font salle comble. C’est un peu transverse à tous mes postes, mais c’est ce dont je suis le plus fière. J’aime aussi parce que ça sert la communauté des X et de l’IA.
En définitive, ce n’est pas pour moi, ça sert à tout le monde. Je sais qu’il y a probablement des collaborations qui ont pu naître, des recrutements qui se sont réalisés, des contrats qui ont été conclus, sans que je le sache forcément ou que je sois impliquée, mais dont je vois les retombées. C’est un impact dur à mesurer, mais très tangible par le fait que les gens en demandent plus. Aujourd’hui, mon souhait est de proposer à tous les membres de la communauté polytechnicienne qui ont envie de contribuer à l’IA de nous contacter.
Commentaire
Ajouter un commentaire
Bonjour, bravo pour cette initiative. J’aimerais pouvoir m’inscrire à ce groupe X IA , pouvez vous m’indiquer la marche à suivre ?