Bag Data

Former des ingénieurs à la science des données

Dossier : TrajectoiresMagazine N°737 Septembre 2018
Par Charles SUTTON (2012)
Par Hervé KABLA (X84)

Créée en 2016, DataS­cien­test offre aux entre­prises une for­ma­tion aux métiers de la data science, qui per­met de déve­lop­per des com­pé­tences en un temps record grâce à une tech­no­lo­gie et une méthode péda­go­gique innovantes.

Comment est née l’idée ?

Elle est née d’une prise de conscience dans la struc­ture de conseil créée avec mes asso­ciés Ben­ja­min Bra­mi et Yoel Tord­j­man : pénu­rie de pro­fils, offre de for­ma­tions plu­tôt limi­tée, néces­si­té pour un grand pan de l’économie fran­çaise d’amorcer une tran­si­tion, flou autour du terme même de data scien­tist. Esti­mant que les pro­fils data scien­tists ne se valaient pas néces­sai­re­ment les uns les autres et qu’il était dif­fi­cile d’évaluer leurs com­pé­tences, nous avons conçu plus d’une cen­taine d’examens pour tes­ter des can­di­dats pour tous les types de postes propres à cet univers.

La socié­té est née du besoin d’un client : le groupe Covea (chez qui nous étions en mis­sion) cher­chait une solu­tion pour faire apprendre la data science à des employés répar­tis sur dif­fé­rents sites, sans sol­li­ci­ter la DSI.

Quel est le parcours des fondateurs ?

J’ai inté­gré l’X après être pas­sé à Paris-Dau­phine où j’ai ren­con­tré les cofon­da­teurs. Yoel (CEO) a ter­mi­né sa for­ma­tion en recherche opé­ra­tion­nelle, puis un mas­ter à l’École des mines. Ben­ja­min (CFO) a sui­vi un par­cours d’ingénierie finan­cière et statistiques.

Qui sont les concurrents ?

La for­ma­tion en data science est très concur­ren­tielle, et nous nous sommes ins­pi­rés de leurs points forts, en ne repro­dui­sant pas leurs points faibles. Les pla­te­formes de MOOCs (Cour­se­ra, ou EdX, FUN) ont une approche clas­sique, sans pro­gram­ma­tion en ligne, qui ne per­met pas une mon­tée en com­pé­tence rapide : les aban­dons en cours sont fréquents.

Nos concur­rents étran­gers (Data­Camp, Data­Quest) ont une approche B2C, alors que nous visons le mar­ché des entre­prises. Les orga­nismes de for­ma­tion pro­fes­sion­nels tra­di­tion­nels n’ont plus trop leur place dans ce pay­sage. Les pla­te­formes data science clés en main, comme Datai­ku, qui ne résolvent pas la ques­tion de l’expertise des utilisateurs.

Quelles ont été les étapes clés depuis la création ?

Notre pre­mier contrat avec Covea nous a per­mis de prou­ver le concept et de pen­ser à une indus­tria­li­sa­tion de la solu­tion. Nous avons pu ensuite béné­fi­cier de finan­ce­ments publics en sub­ven­tions et en prêts d’honneur qui nous ont per­mis de recru­ter nos pre­miers talents. L’année 2017 nous a per­mis de tes­ter et vali­der notre méthode péda­go­gique, et de déve­lop­per un conte­nu riche et com­pé­ti­tif avec les offres concur­rentes. Nous avons obte­nu notre agré­ment de for­ma­tion la même année, ce qui nous a per­mis de rem­por­ter de nom­breux appels d’offres.

Nos pro­chaines étapes sont la fina­li­sa­tion de notre levée de fonds en série A, pour faire gran­dir nos équipes, puis la signa­ture de par­te­na­riats stra­té­giques avec les branches pro­fes­sion­nelles et les ins­ti­tu­tions publiques pour gagner en visi­bi­li­té, le déve­lop­pe­ment d’une offre en ligne B2C et l’acquisition de comptes étrangers.

Quelle est l’originalité de DataScientest ?

Nous avons mis au point une pla­te­forme en ligne qui pro­pose un conte­nu adap­té aux besoins métiers, et nous accom­pa­gnons la mon­tée en com­pé­tence des uti­li­sa­teurs à l’aide d’une méthode péda­go­gique inno­vante. Chaque uti­li­sa­teur a accès à un par­cours sur mesure, qui cor­res­pond à une série de modules cer­ti­fiants. Chaque module com­mence par une série d’« expé­riences data » : un for­mat péda­go­gique à mi-che­min entre une leçon et un exer­cice, et qui se conclut par la réa­li­sa­tion d’un pro­jet final, avec un exa­men de pro­gram­ma­tion en ligne récom­pen­sé par une cer­ti­fi­ca­tion. La réus­site des for­ma­tions sur notre pla­te­forme tient à un accom­pa­gne­ment sur mesure, et l’élimination de tous les conte­nus où l’utilisateur est pas­sif (notam­ment les longues vidéos des cours magis­traux). L’expérience de la pro­gram­ma­tion est cen­trale, et c’est pour­quoi nous avons mis en place une pla­te­forme en ligne qui per­met de pro­gram­mer sans ins­tal­la­tion de logi­ciel préalable.

Est-ce que tout le monde peut devenir data scientist ?

Le poste de data scien­tist requiert des capa­ci­tés d’analyse et de pro­gram­ma­tion qui ne sont pas rapi­de­ment acces­sibles. De nom­breux pro­fes­sion­nels peuvent tou­te­fois envi­sa­ger une recon­ver­sion, ou une mon­tée en com­pé­tence ou une accul­tu­ra­tion au sujet pour gagner en pro­duc­ti­vi­té. Plus de 200 000 per­sonnes ont les bases néces­saires pour deve­nir data scien­tist : cher­cheurs, sta­tis­ti­ciens, actuaires, etc. DataS­cien­test peut déjà les former.

Est-ce le seul besoin de formation à couvrir ?

Non, car il y a aus­si l’acculturation qui concerne beau­coup de monde : le top mana­ge­ment qui doit gagner en connais­sance opé­ra­tion­nelle, les infor­ma­ti­ciens qui col­la­borent avec les data scien­tists et les col­la­bo­ra­teurs tiers qui col­lectent les don­nées utilisées.

Que deviennent les personnes formées par DataScientest ?

La plu­part des 500 uti­li­sa­teurs que nous avons for­més se recon­ver­tissent en tant que data scien­tist dans leurs entre­prises. Les autres ont ame­né une « colo­ra­tion » data dans leur métier. Par exemple, des consul­tants finan­ciers sont pas­sés de Excel à Python pour leurs modèles d’élaboration des prix.

Envisagez-vous d’exporter votre modèle et si oui, où ?

Nous envi­sa­geons une expan­sion d’abord sur les mar­chés fran­co­phones en Europe et au Magh­reb, puis dans le monde anglo­phone : nous fina­li­sons la tra­duc­tion de notre conte­nu péda­go­gique en anglais et sommes en contact avec des groupes d’assurances au Royaume-Uni.

Nos prio­ri­tés sont d’une part les pays où l’usage du big data est avan­cé – USA, Chine, Israël, etc. – car le besoin en data scien­tist y est énorme et d’autre part ceux qui pré­sentent des grands pools d’ingénieurs infor­ma­tiques – Inde, Magh­reb, Viet­nam, Ukraine… – et qui cherchent à mon­ter en compétence.

Data science vs IA, qui gagnera le match ?

La ques­tion est de savoir quel est l’avenir des data science, et où nous en sommes concer­nant l’IA. Les algo­rithmes de deep lear­ning per­mettent d’appréhender de mieux en mieux les don­nées non struc­tu­rées comme le lan­gage natu­rel, l’image ou le son, et vont par­ti­ci­per dans les pro­chaines années à un essor de l’IA.

Deux points sou­lèvent cepen­dant mon inquié­tude. Tout d’abord la RGPD à court terme. Bien que le cor­pus de lois soit posi­tif pour la pro­tec­tion de nos don­nées per­son­nelles, peu de data scien­tists ont été consul­tés et beau­coup de flou sub­siste. Cette réforme risque de tuer dans l’œuf de nom­breux pro­jets de start-up.

Je suis aus­si inquiet de la dia­bo­li­sa­tion de l’IA. Des risques existent, mais il est impor­tant de mieux pré­sen­ter le domaine pour évi­ter les confu­sions et d’ouvrir la porte à toutes sortes de fan­tasmes pessimistes.

Poster un commentaire