Sélectionne des données pour une IA performante.

Kili technology sélectionne les données pour une IA performante

Dossier : TrajectoiresMagazine N°773 Mars 2022
Par Hervé KABLA (X84)

En 2018 Édouard d’Archimbaud (2004) a cofon­dé Kili Tech­no­lo­gy, afin de four­nir aux entre­prises une solu­tion com­plète pour consti­tuer leur IA plus rapi­de­ment et pas­ser avec suc­cès leurs pro­jets d’IA en pro­duc­tion. Il s’agit de mieux gérer les don­nées de for­ma­tion en exploi­tant des fonc­tion­na­li­tés opti­mi­sées. Dis­po­nible en ligne ou sur site, la solu­tion per­met de tirer par­ti des der­nières tech­niques d’apprentissage auto­ma­tique. L’entreprise est recon­nue comme l’un des trois lea­ders mon­diaux sur le sujet.

Quelle est l’activité de Kili Technology ? 

L’intelligence arti­fi­cielle (IA) bou­le­verse nos éco­no­mies en pro­fon­deur. Cepen­dant, pour être intel­li­gente, l’IA a besoin d’apprendre à par­tir de mil­liers d’exemples (image, texte, vidéo, son), qui sont les don­nées d’apprentissage. La qua­li­té de ces don­nées condi­tionne la per­for­mance des algo­rithmes. Notre tra­vail chez Kili Tech­no­lo­gy, c’est de pré­pa­rer les meilleures don­nées d’apprentissage, à par­tir des don­nées brutes des entre­prises, pour amé­lio­rer l’efficacité et la fia­bi­li­té des modèles d’IA.

Quel est le parcours des fondateurs ? 

Issu de la pro­mo­tion 2004, et après un mas­ter MVA (mathé­ma­tiques, vision, appren­tis­sage) de l’ENS Cachan, je suis deve­nu direc­teur tech­nique de Kili Tech­no­lo­gy, entre­prise que j’ai cofon­dée en 2018 avec Fran­çois-Xavier Leduc (EM Lyon Busi­ness School), direc­teur géné­ral. Je me consi­dère comme un data scien­tist. Avant de créer Kili Tech­no­lo­gy, j’ai notam­ment diri­gé le lab Data Science et intel­li­gence arti­fi­cielle de BNP Pari­bas CIB. Fran­çois-Xavier Leduc a un pro­fil de mul­ti-entre­pre­neur. Il a, par le pas­sé, cofon­dé Tripn­drive, une pla­te­forme d’autopartage dans les gares et les aéroports.

Comment t’est venue l’idée ?

Quand je tra­vaillais au labo d’IA de BNP Pari­bas CIB, notre plus gros tra­vail était de pré­pa­rer les don­nées pour nos pro­grammes d’IA. Nous avons déve­lop­pé notre outil pour anno­ter nos don­nées en interne. J’ai com­pris que toutes les entre­prises allaient faire face au même enjeu stra­té­gique de ges­tion des don­nées. En fon­dant Kili Tech­no­lo­gy, je vou­lais créer la meilleure pla­te­forme de ges­tion des don­nées pour répondre aux pro­blèmes des data scien­tists et aider les entre­prises à déployer l’IA à grande échelle. 

Qui sont les concurrents ? 

Kili Tech­no­lo­gy opère dans un domaine en pleine struc­tu­ra­tion, qui n’existait pas il y a trois ans. Alors qu’on par­lait hier uni­que­ment d’annotation de don­nées, on évoque aujourd’hui la data-cen­tric AI, qui com­prend l’annotation et la sélec­tion en amont des don­nées d’entraînement, pour cou­vrir tous les cas d’application de l’IA. Nous sommes régu­liè­re­ment cités par les experts de l’IA, dont le cher­cheur amé­ri­cain Andrew Ng (spé­cia­liste de l’apprentissage infor­ma­tique et cofon­da­teur de Cour­se­ra), comme l’un des trois lea­ders mon­diaux sur le sujet. Nous vou­lons confor­ter ce lea­der­ship dans les années qui viennent.

Quelles ont été les étapes clés depuis la création ?

Nous avons déve­lop­pé Kili Tech­no­lo­gy sur fonds propres pen­dant les deux pre­mières années, pour déve­lop­per le meilleur pro­duit et affi­ner notre fit to mar­ket. Le suc­cès est au ren­dez-vous : nous enre­gis­trons une très forte crois­sance auprès des grandes entre­prises et des scale-up de l’IA. Nous avons réa­li­sé deux levées de fonds en jan­vier et juillet 2021 pour accé­lé­rer notre déve­lop­pe­ment et notre expan­sion inter­na­tio­nale (Asie et États-Unis).

Peut-on encore envisager de nos jours une IA qui ne soit pas data-centric ?

La data-cen­tric AI n’est pas une mode, c’est l’avenir de l’IA ! De nom­breux cher­cheurs insistent sur ce nou­veau para­digme pour ren­for­cer la per­for­mance de l’IA. Tra­vailler à par­tir de la don­née per­met de sélec­tion­ner pré­ci­sé­ment les don­nées néces­saires à l’application de l’IA et de véri­fier la qua­li­té de ces don­nées. Cela per­met sur­tout de tes­ter en conti­nu la per­for­mance des modèles à par­tir des don­nées d’entraînement et d’inspecter fine­ment les cas de défaillance pour les résoudre un à un, en amé­lio­rant la qua­li­té et la com­po­si­tion des don­nées d’apprentissage.

Le risque d’un internet à deux vitesses ou sous contrôle, comme en Chine, est-il une menace pour l’IA ?

Je ne pense pas que ce soit une menace. Mais nous devons accé­lé­rer en France et en Europe sur toutes les tech­no­lo­gies autour de l’IA, du cloud, du méta­vers, de la blo­ck­chain. Nous nous tar­guons d’être bons en mathé­ma­tiques en France, mais je constate que nous sommes plu­tôt en retard en IA par rap­port à nos voi­sins (UK, Suisse, Israël). Nous devons inves­tir sans hési­ta­tion tous ces champs d’application, maî­tri­ser ces tech­no­lo­gies et pro­mou­voir un usage au béné­fice de la socié­té, telle que nous la défi­nis­sons en Europe. La direc­tive euro­péenne qui vise à favo­ri­ser le déve­lop­pe­ment d’une IA de confiance est une ini­tia­tive posi­tive, mais il ne faut pas frei­ner l’innovation, ce qui entraî­ne­rait un exode des entre­prises vers les pays tiers. Nous devons pré­ser­ver notre auto­no­mie stra­té­gique sur ces tech­no­lo­gies en favo­ri­sant la crois­sance d’entreprises lea­ders en Europe. 

Penses-tu que l’IA deviendra un jour un produit grand public, comme un traitement de texte ou un navigateur internet ? 

L’IA est deve­nue une tech­no­lo­gie d’intérêt géné­ral (auto­ma­ti­sa­tion d’un nombre crois­sant de tâches, gains de pro­duc­ti­vi­té) qui va conti­nuer à se dif­fu­ser de manière crois­sante dans nos socié­tés, comme hier l’électricité, l’informatique ou inter­net. Je pense que demain la majo­ri­té des IA ne seront plus conçues au niveau du code, mais à un niveau d’abstraction plus éle­vé, en mani­pu­lant de la don­née, ce qui per­met­tra une dif­fu­sion plus rapide et plus pro­fonde. Aujourd’hui, il faut un bon bagage en com­pu­ter science et en mathé­ma­tiques pour conce­voir des pro­grammes d’IA, mais demain cela ne sera plus nécessaire.

On parle de plus en plus de l’impact énergétique et environnemental de la data. Gros fake ou vrai problème ? 

Les tech­no­lo­gies de sto­ckage et de ges­tion des don­nées sont for­te­ment consom­ma­trices d’énergie, ce qui pose évi­dem­ment pro­blème dans un contexte de néces­saire sobrié­té éner­gé­tique, alors que les don­nées vont conti­nuer à explo­ser. La data-cen­tric AI est une solu­tion qui per­met de ratio­na­li­ser la ges­tion de don­nées. Nous esti­mons que 40 % des don­nées anno­tées sont inutiles, parce que trop proches de don­nées déjà exis­tantes dans le data­set d’entraînement. Chez Kili Tech­no­lo­gy, nous accom­pa­gnons nos clients dans la défi­ni­tion en amont des typo­lo­gies de don­nées néces­saires en fonc­tion des pro­blé­ma­tiques à trai­ter. Grâce à la data-cen­tric AI, nous pro­mou­vons une ges­tion intel­li­gente de la don­née qui per­met de savoir ce qui se passe, de ratio­na­li­ser le sto­ckage et d’arbitrer entre le néces­saire et le superflu.

Conseillerais-tu aux jeunes X de s’orienter encore vers l’IA et, si oui, pourquoi ? 

Évi­dem­ment, je conseille­rais aux jeunes X de s’orienter vers l’IA. C’est un domaine pas­sion­nant, où beau­coup de choses sont encore à construire et à décou­vrir ! Mais je leur conseille­rais de pri­vi­lé­gier une double for­ma­tion, qui allie théo­rie scien­ti­fique et appli­ca­tion, type mas­ter MVA et école 42. Conce­voir un pro­gramme d’IA, c’est 10 % de théo­rie et 90 % de pro­gram­ma­tion. Sur la théo­rie, les X sont au top, mais nous avons des pro­grès à faire en programmation.


Poster un commentaire