Episode 3 - Spécial Data Governance

1 - Vouloir mettre une data gouvernance sans impacter l’organisation en place

La mise en place de la Data Governance s’inscrit dans une transformation d’entreprise, un changement de paradigme. Le modèle data driven met la donnée à tous les niveaux de la société afin de d‘éclairer les décisions à prendre. Comme dans toute transformation, l’autogestion ne marche pas. Il faut orchestrer, et dans un orchestre il y a un chef. On l’appellera Chief Data Officer (CDO).  

Cette personne devra s’appuyer sur des communautés composées de métiers, de personnes de l’IT, de managers et sera le point de contact pour la data.

2 - Ne pas identifier les communautés et les leaders

Préalablement à cette nomination (CDO), il sera primordial de faire naître des communautés. Des communautés par service ou mieux par type d’utilisateur. On distinguera alors les consommateurs de données, les créateurs de données et les administrateurs des données (plus orientés IT). Maintenant que les communautés sont créées, il faut nommer un leader pour animer la communauté. L’animation passe par les réunions internes, évènements, rappel des bonnes pratiques, etc. Ces leaders jouent un rôle particulièrement important dans l’adhésion, la créativité, et la réussite de la transformation. 

3 - Data Governance = IT ?

Le modèle Data Driven rééquilibre les fonctions de l’entreprise et l’IT est un service support à l’entreprise. L’IT rendra possible le fait d’exposer les données à tous les niveaux de la société. Mais ce n’est pas elle qui génère, certifie, donne les règles de validation et d’enrichissement, etc. 

Vous l’aurez compris, la Data Governance n’appartient pas à l’IT, mais sans l’IT la gouvernance des données ne peut pas atteindre son optimum.  

4 - Une architecture non évolutive ?

Avec une évolution annuelle en volume de données qui dépasse parfois 100%, sur un fond dynamique d’exode ou de retour des données et des fonctions sur / depuis le cloud, la « scalabilité » n’a jamais été aussi importante. Avec le développement technologique, on voit naître la notion de XaaS (Everything As A Service). Les données sont donc en partie on-premise et en partie sur le cloud. L’architecture informatique et logicielle doivent évoluer pour intégrer cette composante. 

5 - Un référentiel trop grand

Une transformation « Big Bang » est contraire à l’approche Data DrivenC’est une transformation agile, et par conséquent cyclique et incrémentale. Un des fondamentaux de la méthodologie Drive, utilisée dans les projets d’analytiques modernes, est de commencer avec un petit scope de données.  

6 - Une évolution trop rapide du scope du Big Data

Dans cette approche on applique les concepts du Six Sigma. La philosophie est d’analyser les processus ou les mesures, afin de cerner les problèmes organisationnels. Sans une phase de retour d’expérience, il n’est pas possible d’appliquer les 5 étapes de la roue non pas de Deming, celle-ci sert pour la qualité, mais de DMAIC  

  • Define  
  • Measure 
  • Analyse 
  • Improve  
  • Control 

Par conséquent il serait contre-productif de faire évoluer trop rapidement le scope des données. Il est donc primordial de construire des fondations solides et pérennes. 

7 - L’utilisation excessive de données hors SI

Mise à part Google (et encore nous émettons des doutes), quelle société n’a pas au moins une personne qui gère ses données hors SI ?? Quelques exemples dans l’industrie : la commande d’achat passée mais pas encore enregistrée dans le système, la livraison arrivée sur le dock mais pas encore contrôlée donc pas encore enregistrée dans le SI, ou encore le contrôle qualité passé défavorablement et le produit renvoyé au fournisseur pas encore enregistré dans le SI… Plus ces données hors système s’accumulent, plus la qualité de l’information se dégrade. Il y a de cela quelques années, nous pouvions encore laisser un délai pour régulariser ces actes de gestion, car la BI se basait régulièrement sur des extractions hebdomadaires pour faire le bilan de la semaine, mais avec l’analytique moderne, la donnée est abordée en temps réel. Donc, plus on sera près de la réalité, plus on gagnera en qualité. De plus, la saisie (dans un cahier ou dans un fichier Excel que vous connaissez bien !) puis la ressaisie dans le système d’information induit un risque d’erreurs. Celles-ci engendrent d’éventuelles créations de doublons amenant une erreur d’interprétation menant à une décision non éclairée.  

Des exemples de fichiers qui devraient intégrer le SI : 

  • Dans la plupart des fusions/acquisitions, il subsiste des fichiers de mapping des services, références produits, comptables  
  • Les fichesproduits en cours de développement dans un SI sans PLM (Product Lifecycle Management)