Former des ingénieurs à la science des données
Créée en 2016, DataScientest offre aux entreprises une formation aux métiers de la data science, qui permet de développer des compétences en un temps record grâce à une technologie et une méthode pédagogique innovantes.
Comment est née l’idée ?
Elle est née d’une prise de conscience dans la structure de conseil créée avec mes associés Benjamin Brami et Yoel Tordjman : pénurie de profils, offre de formations plutôt limitée, nécessité pour un grand pan de l’économie française d’amorcer une transition, flou autour du terme même de data scientist. Estimant que les profils data scientists ne se valaient pas nécessairement les uns les autres et qu’il était difficile d’évaluer leurs compétences, nous avons conçu plus d’une centaine d’examens pour tester des candidats pour tous les types de postes propres à cet univers.
La société est née du besoin d’un client : le groupe Covea (chez qui nous étions en mission) cherchait une solution pour faire apprendre la data science à des employés répartis sur différents sites, sans solliciter la DSI.
Quel est le parcours des fondateurs ?
J’ai intégré l’X après être passé à Paris-Dauphine où j’ai rencontré les cofondateurs. Yoel (CEO) a terminé sa formation en recherche opérationnelle, puis un master à l’École des mines. Benjamin (CFO) a suivi un parcours d’ingénierie financière et statistiques.
Qui sont les concurrents ?
La formation en data science est très concurrentielle, et nous nous sommes inspirés de leurs points forts, en ne reproduisant pas leurs points faibles. Les plateformes de MOOCs (Coursera, ou EdX, FUN) ont une approche classique, sans programmation en ligne, qui ne permet pas une montée en compétence rapide : les abandons en cours sont fréquents.
Nos concurrents étrangers (DataCamp, DataQuest) ont une approche B2C, alors que nous visons le marché des entreprises. Les organismes de formation professionnels traditionnels n’ont plus trop leur place dans ce paysage. Les plateformes data science clés en main, comme Dataiku, qui ne résolvent pas la question de l’expertise des utilisateurs.
Quelles ont été les étapes clés depuis la création ?
Notre premier contrat avec Covea nous a permis de prouver le concept et de penser à une industrialisation de la solution. Nous avons pu ensuite bénéficier de financements publics en subventions et en prêts d’honneur qui nous ont permis de recruter nos premiers talents. L’année 2017 nous a permis de tester et valider notre méthode pédagogique, et de développer un contenu riche et compétitif avec les offres concurrentes. Nous avons obtenu notre agrément de formation la même année, ce qui nous a permis de remporter de nombreux appels d’offres.
Nos prochaines étapes sont la finalisation de notre levée de fonds en série A, pour faire grandir nos équipes, puis la signature de partenariats stratégiques avec les branches professionnelles et les institutions publiques pour gagner en visibilité, le développement d’une offre en ligne B2C et l’acquisition de comptes étrangers.
Quelle est l’originalité de DataScientest ?
Nous avons mis au point une plateforme en ligne qui propose un contenu adapté aux besoins métiers, et nous accompagnons la montée en compétence des utilisateurs à l’aide d’une méthode pédagogique innovante. Chaque utilisateur a accès à un parcours sur mesure, qui correspond à une série de modules certifiants. Chaque module commence par une série d’« expériences data » : un format pédagogique à mi-chemin entre une leçon et un exercice, et qui se conclut par la réalisation d’un projet final, avec un examen de programmation en ligne récompensé par une certification. La réussite des formations sur notre plateforme tient à un accompagnement sur mesure, et l’élimination de tous les contenus où l’utilisateur est passif (notamment les longues vidéos des cours magistraux). L’expérience de la programmation est centrale, et c’est pourquoi nous avons mis en place une plateforme en ligne qui permet de programmer sans installation de logiciel préalable.
Est-ce que tout le monde peut devenir data scientist ?
Le poste de data scientist requiert des capacités d’analyse et de programmation qui ne sont pas rapidement accessibles. De nombreux professionnels peuvent toutefois envisager une reconversion, ou une montée en compétence ou une acculturation au sujet pour gagner en productivité. Plus de 200 000 personnes ont les bases nécessaires pour devenir data scientist : chercheurs, statisticiens, actuaires, etc. DataScientest peut déjà les former.
Est-ce le seul besoin de formation à couvrir ?
Non, car il y a aussi l’acculturation qui concerne beaucoup de monde : le top management qui doit gagner en connaissance opérationnelle, les informaticiens qui collaborent avec les data scientists et les collaborateurs tiers qui collectent les données utilisées.
Que deviennent les personnes formées par DataScientest ?
La plupart des 500 utilisateurs que nous avons formés se reconvertissent en tant que data scientist dans leurs entreprises. Les autres ont amené une « coloration » data dans leur métier. Par exemple, des consultants financiers sont passés de Excel à Python pour leurs modèles d’élaboration des prix.
Envisagez-vous d’exporter votre modèle et si oui, où ?
Nous envisageons une expansion d’abord sur les marchés francophones en Europe et au Maghreb, puis dans le monde anglophone : nous finalisons la traduction de notre contenu pédagogique en anglais et sommes en contact avec des groupes d’assurances au Royaume-Uni.
Nos priorités sont d’une part les pays où l’usage du big data est avancé – USA, Chine, Israël, etc. – car le besoin en data scientist y est énorme et d’autre part ceux qui présentent des grands pools d’ingénieurs informatiques – Inde, Maghreb, Vietnam, Ukraine… – et qui cherchent à monter en compétence.
Data science vs IA, qui gagnera le match ?
La question est de savoir quel est l’avenir des data science, et où nous en sommes concernant l’IA. Les algorithmes de deep learning permettent d’appréhender de mieux en mieux les données non structurées comme le langage naturel, l’image ou le son, et vont participer dans les prochaines années à un essor de l’IA.
Deux points soulèvent cependant mon inquiétude. Tout d’abord la RGPD à court terme. Bien que le corpus de lois soit positif pour la protection de nos données personnelles, peu de data scientists ont été consultés et beaucoup de flou subsiste. Cette réforme risque de tuer dans l’œuf de nombreux projets de start-up.
Je suis aussi inquiet de la diabolisation de l’IA. Des risques existent, mais il est important de mieux présenter le domaine pour éviter les confusions et d’ouvrir la porte à toutes sortes de fantasmes pessimistes.