La gouvernance de la data est une affaire de statégie
Qu’entend-on par gouvernance des données dans l’entreprise ?
La gouvernance des données est une mission opérationnelle et stratégique.
Dans le cas d’une entreprise qui s’investit dans un projet data, elle implique de prendre en considération les divers impacts liés à l’afflux massif des données dont l’un est lié aux nouvelles menaces qui vont obliger les directions informatiques à revoir leur sécurité.
La data gouvernance est-elle la chasse gardée des DSI ?
Non, c’est pour cela que cette mission est, dans la majorité des cas, chapeautée par le CDO (directeur des données) et non par le CTO (directeur de la technologie).
On n’appréhende pas de la même façon le contenu (la data) et le contenant (le système informatique).
Quels sont les risques en cas de mauvaise gouvernance ?
Il est primordial de s’assurer de la fiabilité des données et la notion de data quality doit être mise en œuvre et respectée. Sinon, nous sommes dans un risque de dégradation de l’image et de la réputation de l’entreprise vis-à-vis des clients et des partenaires.
Il existe aussi un risque de statut : prenons ainsi Altares, qui est « tiers de confiance » dans la chaîne d’acheminement de la data : s’il y a une défaillance à quelque niveau que ce soit, les conséquences seront importantes par rapport à ce « label ».
Il y a enfin un risque lié à la matière première, la data qui peut être corrompue soit de façon involontaire, soit par une action malveillante voulue.
Comment, justement, garantir l’exactitude, la fraîcheur et la complétude d’une donnée ?
C’est un métier, notre métier ! Il est indispensable de s’assurer que la provenance des données ne puisse être remise en cause à la fois pour les raisons de sécurité évoquées ci-dessus, mais aussi pour des raisons de stabilité et de régulation (la donnée est une matière vivante qui doit pouvoir être traçable).
Sur ce dernier point, il faut être particulièrement vigilant.
Avez-vous un exemple ?
Un exemple tout simple : quand on loue un fichier avec des noms, il faut pouvoir s’assurer que les personnes citées peuvent à tout moment prendre la décision d’en retirer leur nom.
On est ici dans une nécessité de réactivité qui paraît évidente sur le papier, mais qui, dans la pratique, représente une énorme contrainte qui devra être absorbée par une infrastructure spécifique et performante.
Comment se concentrer sur les données ayant une valeur importante pour l’entreprise ?
Il y a deux types de valeur data pour l’entreprise : la valeur métier, opérationnelle et la valeur structurelle, interne.
Dans le premier cas, on est un peu sur un modèle de data on demand : on sélectionne et on travaille les données en fonction des objectifs métiers de l’entreprise (marketing, acquisition, fidélisation, production, gestion des ressources humaines, risque…).
Dans le second cas, on parle des données référentielles qui sont gérées par le système GDR (Gestion des Données Référentielles) ou Master Data Management (MDM) et qui sont les données internes qui vont servir à piloter la digitalisation des process.
C’est le volet purement « techno-data » de la gouvernance et c’est la base qui va servir à piloter le sourcing des datas, à conditionner toute la chaîne de production en amont (stockage, maintenance, distribution…).
Quelles démarches l’entreprise doit-elle mettre en œuvre pour gouverner ses données ?
Elle doit répondre à plusieurs questions, qui ont d’ailleurs été « officialisées » par l’ISACA, l’association professionnelle internationale de référence dans le domaine de la gouvernance des systèmes d’informations :
- quelle confiance porter aux bases de données ?
- À quels types appartiennent les informations qui sont collectées et quels sont les défis juridiques et réglementaires qui y sont liés ?
- Comment protéger les sources, les processus et les décisions contre le vol et la corruption ?
- Comment est assurée la confidentialité des informations, quelles politiques et quels processus ont été mis en place vis-à-vis des employés ?
- Quels sont les actes de l’entreprise pouvant être exploités par ses adversaires ?
Par où commencer ?
“ LA GOUVERNANCE DES DONNÉES EST UN PROJET PLUTÔT TRANSVERSAL ET QUI IMPLIQUE BEAUCOUP DE COMPÉTENCES DANS L’ENTREPRISE ”, EXPLIQUE CHARLES BATTISTA
On peut ne rien mettre en place au niveau de la gouvernance s’il n’y a pas une décision stratégique prise par la direction générale. Ce type de décision implique tout le monde et est irrémédiable.
Beaucoup d’entreprises commencent par la rédaction de guidelines exhaustives permettant de savoir où on va et par quels moyens on y va (référentiel, data warehouse, data lake, etc.)
Quels bénéfices peut-elle en tirer et comment les mesurer ?
Je vois 3 bénéfices principaux :
- La connaissance clients qui aidera à rationaliser les offres
- La fluidification de la communication interne et externe
- Le renforcement du statut de tiers de confiance qui est vital pour des acteurs dont la data est le cœur d’activité.
Quelles sont les contraintes réglementaires appliquées aux entreprises ?
Elles sont, pour le meilleur et pour le pire, très nombreuses. D’aucuns parlent même de litanie réglementaire !
Rien que la fameuse GDPR (General Data Protection Regulation) ou autrement dit la Réglementation européenne sur la protection des données entrée en vigueur en mai 2016 (et applicable en mai 2018) est un corpus de 99 articles de lois !
Ajoutons ensuite les lois franco-françaises et les réglementations spécifiques à chaque secteur d’activité. La montagne est haute !
Toutes ces contraintes sont à intégrer à la fois dans la conception et la construction du référentiel data, mais également dans la construction des modèles qui viennent répondre aux exigences des projets data spécifiques de l’entreprise ou de ses clients.
Quels sont les acteurs de cette gouvernance des données et est-ce que cela implique de nouveaux métiers ?
Les avocats et les juristes !
Plus sérieusement, la gouvernance est un projet plutôt transversal et qui implique beaucoup de compétences dans l’entreprise.
On part donc de la direction générale qui donne l’impulsion et la stratégie, on embarque un CDO qui va être le « master and commander » du projet, un CTO qui sera câblé sur les nouvelles problématiques liées à la data, des datas scientists, des analystes, des développeurs et tous les représentants des métiers de l’entreprise qui peuvent apporter leur contribution opérationnelle à la gouvernance.
En plus de ces métiers, ce sont aussi de nouvelles méthodes de travail, forcément plus transversales, plus agiles (DevOps, Lean Management) qui seront mises en place.
Comment voyez-vous l’avenir de la gouvernance des données ?
Il s’articule autour de 2 thèmes : la digitalisation réelle des entreprises et, en parallèle, l’Open Data. Ces transformations entrainent de nouvelles problématiques :
- Nouveaux référentiels : On parle de la qualité et de la longévité des données sous une forme exploitable et standardisée ; il faudra trouver un format stable spécifique pour la conception des modèles.
- Nouvelles relations : la relation fournisseur/ client n’est pas la même si la donnée est gratuite ou si le fournisseur est payant.
- Nouveaux modèles économiques : L’arrivée de nouveaux acteurs low cost de la fourniture de données vont faire tomber des barrières ; les acteurs traditionnels n’auront d’autre choix que de sortir par le haut en proposant de la valeur ajoutée en termes de services ou de conseil stratégique.
Par ailleurs, la data est en voie de transformer le business model des entreprises data driven qui passeront d’une logique de ROI à une logique de R.O.D.I (Return On Data Investment).