Un peu de code calcul dans la Data

La gouvernance de la data est une affaire de statégie

Dossier : Dossier FFEMagazine N°725 Mai 2017
Par Charles BATTISTA

Qu’entend-on par gouvernance des données dans l’entreprise ?

La gou­ver­nance des don­nées est une mis­sion opé­ra­tion­nelle et stratégique. 

Dans le cas d’une entre­prise qui s’investit dans un pro­jet data, elle implique de prendre en consi­dé­ra­tion les divers impacts liés à l’afflux mas­sif des don­nées dont l’un est lié aux nou­velles menaces qui vont obli­ger les direc­tions infor­ma­tiques à revoir leur sécurité. 

La data gouvernance est-elle la chasse gardée des DSI ?

Non, c’est pour cela que cette mis­sion est, dans la majo­ri­té des cas, cha­peau­tée par le CDO (direc­teur des don­nées) et non par le CTO (direc­teur de la technologie). 

On n’appréhende pas de la même façon le conte­nu (la data) et le conte­nant (le sys­tème informatique). 

Quels sont les risques en cas de mauvaise gouvernance ?

Il est pri­mor­dial de s’assurer de la fia­bi­li­té des don­nées et la notion de data qua­li­ty doit être mise en œuvre et res­pec­tée. Sinon, nous sommes dans un risque de dégra­da­tion de l’image et de la répu­ta­tion de l’entreprise vis-à-vis des clients et des partenaires. 

Il existe aus­si un risque de sta­tut : pre­nons ain­si Altares, qui est « tiers de confiance » dans la chaîne d’acheminement de la data : s’il y a une défaillance à quelque niveau que ce soit, les consé­quences seront impor­tantes par rap­port à ce « label ». 

Il y a enfin un risque lié à la matière pre­mière, la data qui peut être cor­rom­pue soit de façon invo­lon­taire, soit par une action mal­veillante voulue. 

Comment, justement, garantir l’exactitude, la fraîcheur et la complétude d’une donnée ?

C’est un métier, notre métier ! Il est indis­pen­sable de s’assurer que la pro­ve­nance des don­nées ne puisse être remise en cause à la fois pour les rai­sons de sécu­ri­té évo­quées ci-des­sus, mais aus­si pour des rai­sons de sta­bi­li­té et de régu­la­tion (la don­née est une matière vivante qui doit pou­voir être traçable). 

Sur ce der­nier point, il faut être par­ti­cu­liè­re­ment vigilant. 

Avez-vous un exemple ?

Un exemple tout simple : quand on loue un fichier avec des noms, il faut pou­voir s’assurer que les per­sonnes citées peuvent à tout moment prendre la déci­sion d’en reti­rer leur nom. 

On est ici dans une néces­si­té de réac­ti­vi­té qui paraît évi­dente sur le papier, mais qui, dans la pra­tique, repré­sente une énorme contrainte qui devra être absor­bée par une infra­struc­ture spé­ci­fique et performante. 

Comment se concentrer sur les données ayant une valeur importante pour l’entreprise ?

Il y a deux types de valeur data pour l’entreprise : la valeur métier, opé­ra­tion­nelle et la valeur struc­tu­relle, interne. 

Dans le pre­mier cas, on est un peu sur un modèle de data on demand : on sélec­tionne et on tra­vaille les don­nées en fonc­tion des objec­tifs métiers de l’entreprise (mar­ke­ting, acqui­si­tion, fidé­li­sa­tion, pro­duc­tion, ges­tion des res­sources humaines, risque…). 

Dans le second cas, on parle des don­nées réfé­ren­tielles qui sont gérées par le sys­tème GDR (Ges­tion des Don­nées Réfé­ren­tielles) ou Mas­ter Data Mana­ge­ment (MDM) et qui sont les don­nées internes qui vont ser­vir à pilo­ter la digi­ta­li­sa­tion des process. 

C’est le volet pure­ment « tech­no-data » de la gou­ver­nance et c’est la base qui va ser­vir à pilo­ter le sour­cing des datas, à condi­tion­ner toute la chaîne de pro­duc­tion en amont (sto­ckage, main­te­nance, distribution…). 

Quelles démarches l’entreprise doit-elle mettre en œuvre pour gouverner ses données ?

Elle doit répondre à plu­sieurs ques­tions, qui ont d’ailleurs été « offi­cia­li­sées » par l’ISACA, l’association pro­fes­sion­nelle inter­na­tio­nale de réfé­rence dans le domaine de la gou­ver­nance des sys­tèmes d’informations :

  • quelle confiance por­ter aux bases de données ? 
  • À quels types appar­tiennent les infor­ma­tions qui sont col­lec­tées et quels sont les défis juri­diques et régle­men­taires qui y sont liés ? 
  • Com­ment pro­té­ger les sources, les pro­ces­sus et les déci­sions contre le vol et la corruption ? 
  • Com­ment est assu­rée la confi­den­tia­li­té des infor­ma­tions, quelles poli­tiques et quels pro­ces­sus ont été mis en place vis-à-vis des employés ? 
  • Quels sont les actes de l’entreprise pou­vant être exploi­tés par ses adversaires ? 

Par où commencer ?

“ LA GOUVERNANCE DES DONNÉES EST UN PROJET PLUTÔT TRANSVERSAL ET QUI IMPLIQUE BEAUCOUP DE COMPÉTENCES DANS L’ENTREPRISE ”, EXPLIQUE CHARLES BATTISTA

On peut ne rien mettre en place au niveau de la gou­ver­nance s’il n’y a pas une déci­sion stra­té­gique prise par la direc­tion géné­rale. Ce type de déci­sion implique tout le monde et est irrémédiable. 

Beau­coup d’entreprises com­mencent par la rédac­tion de gui­de­lines exhaus­tives per­met­tant de savoir où on va et par quels moyens on y va (réfé­ren­tiel, data ware­house, data lake, etc.) 

Quels bénéfices peut-elle en tirer et comment les mesurer ?

Je vois 3 béné­fices principaux : 

  • La connais­sance clients qui aide­ra à ratio­na­li­ser les offres 
  • La flui­di­fi­ca­tion de la com­mu­ni­ca­tion interne et externe 
  • Le ren­for­ce­ment du sta­tut de tiers de confiance qui est vital pour des acteurs dont la data est le cœur d’activité.

Quelles sont les contraintes réglementaires appliquées aux entreprises ?

Elles sont, pour le meilleur et pour le pire, très nom­breuses. D’aucuns parlent même de lita­nie réglementaire ! 

Rien que la fameuse GDPR (Gene­ral Data Pro­tec­tion Regu­la­tion) ou autre­ment dit la Régle­men­ta­tion euro­péenne sur la pro­tec­tion des don­nées entrée en vigueur en mai 2016 (et appli­cable en mai 2018) est un cor­pus de 99 articles de lois ! 

Ajou­tons ensuite les lois fran­co-fran­çaises et les régle­men­ta­tions spé­ci­fiques à chaque sec­teur d’activité. La mon­tagne est haute ! 

Toutes ces contraintes sont à inté­grer à la fois dans la concep­tion et la construc­tion du réfé­ren­tiel data, mais éga­le­ment dans la construc­tion des modèles qui viennent répondre aux exi­gences des pro­jets data spé­ci­fiques de l’entreprise ou de ses clients. 

Quels sont les acteurs de cette gouvernance des données et est-ce que cela implique de nouveaux métiers ?

Les avo­cats et les juristes ! 

Plus sérieu­se­ment, la gou­ver­nance est un pro­jet plu­tôt trans­ver­sal et qui implique beau­coup de com­pé­tences dans l’entreprise.

On part donc de la direc­tion géné­rale qui donne l’impulsion et la stra­té­gie, on embarque un CDO qui va être le « mas­ter and com­man­der » du pro­jet, un CTO qui sera câblé sur les nou­velles pro­blé­ma­tiques liées à la data, des datas scien­tists, des ana­lystes, des déve­lop­peurs et tous les repré­sen­tants des métiers de l’entreprise qui peuvent appor­ter leur contri­bu­tion opé­ra­tion­nelle à la gouvernance. 

En plus de ces métiers, ce sont aus­si de nou­velles méthodes de tra­vail, for­cé­ment plus trans­ver­sales, plus agiles (DevOps, Lean Mana­ge­ment) qui seront mises en place. 

Comment voyez-vous l’avenir de la gouvernance des données ?

Il s’articule autour de 2 thèmes : la digi­ta­li­sa­tion réelle des entre­prises et, en paral­lèle, l’Open Data. Ces trans­for­ma­tions entrainent de nou­velles problématiques : 

  • Nou­veaux réfé­ren­tiels : On parle de la qua­li­té et de la lon­gé­vi­té des don­nées sous une forme exploi­table et stan­dar­di­sée ; il fau­dra trou­ver un for­mat stable spé­ci­fique pour la concep­tion des modèles. 
  • Nou­velles rela­tions : la rela­tion fournisseur/ client n’est pas la même si la don­née est gra­tuite ou si le four­nis­seur est payant. 
  • Nou­veaux modèles éco­no­miques : L’arrivée de nou­veaux acteurs low cost de la four­ni­ture de don­nées vont faire tom­ber des bar­rières ; les acteurs tra­di­tion­nels n’auront d’autre choix que de sor­tir par le haut en pro­po­sant de la valeur ajou­tée en termes de ser­vices ou de conseil stratégique.
    Par ailleurs, la data est en voie de trans­for­mer le busi­ness model des entre­prises data dri­ven qui pas­se­ront d’une logique de ROI à une logique de R.O.D.I (Return On Data Investment).
     

Page de publicité Altares

Poster un commentaire