📊 La Modern data stack : une réponse agile et sécurisée aux défis des fusions et acquisitions
Dans le contexte dynamique des fusions et acquisitions, les entreprises se retrouvent confrontées à d’importants défis de convergence, notamment au niveau des systèmes d’information. Le choix stratégique d’un ERP ou d’un CRM cible est crucial et peut s’étendre sur plusieurs années. Pourtant, la nécessité de disposer de rapports de gestion consolidés est immédiate et impérative. Au niveau du groupe, le besoin de reporting de gestion est plus pressant, et il est rarement envisageable d’attendre la fin de la convergence pour disposer de tableaux de bords consolidés à l’échelle d’un groupe.
Et, détail qui a son importance, l’élaboration de ces tableaux de bord nécessite la consolidation de données fines, pas la consolidation de données agrégées ! J’insiste sur ce point car c’est la raison pour laquelle la plateforme de données entre en jeu.
La nécessité d’une consolidation efficace
Dans ce cadre complexe, la Modern Data Stack émerge comme la solution idéale pour une consolidation rapide et efficace des données entre les différentes entités. Chaque entité a son SI, sans doute déjà une BI en place. Selon le besoin, on souhaite s’accrocher à la BI de l’entité ou directement aux données sources du SI.
Les plateformes data nouvelles générations permettent de connecter des systèmes d’information hétérogènes sans nécessiter leur convergence immédiate. Imaginez une entreprise sur GCP BigQuery et une autre sur Snowflake ; il est très facile de mettre en place un partage de données sécurisé (eg : External Stage snowflake permettent de lire des buckets GCP dans le cas d’import, ou d’écrire dans le cas d’un export, le tout très simplement, et sans problématique de volumétrie ou de performance).
La pratique de l’ELT dans un Datawarehouse Cloud est gage de productivité et d’agilité dans un groupe en pleine construction. C’est la promesse des Modern Data Stack, synonyme de vélocité tant dans les développements que dans les traitements, de transparence au travers de processus qualités contrôlés avec du Devops
En somme, les technologies modernes permettent de faire vite et bien, et d’envisager plus loin.
Bien, mais non suffisant !
L’importance de la modélisation décisionnelle
Même avec les meilleures technologies et les meilleurs Cloud Data Warehouse, le succès de ces projets tient pour beaucoup à des efforts de modélisation particuliers pour concrétiser dans les données le mouvement de convergence. La modélisation multi-dimensionnelle a pour vertu de découpler le Data Warehouse des modèles de données source pour aboutir à une modélisation par « objets d’entreprise ». Ces objets, pour des sociétés d’activités similaires, ne changeront pas. Une commande est une commande, un contrat est un contrat. Que ce soit stocké dans 3 tables dans le système A et dans 1 table dans le système B n’a pas d’impact. J’illustre ce principe par un exemple de datawarehouse d’entreprise dans le cadre de fusions/acquisitions.
Un cas concret : La dimension client dans une fusion
Prenons l’exemple de la consolidation des données clients. En créant une dimension client unique à partir des référentiels de chaque société, nous pouvons dédoublonner les informations sur des critères comme le SIRET, permettant ainsi des analyses précises tant au niveau consolidé que par entité.
Cas d’une dimension :
- table dwh_dim_client__societeB => c’est mon référentiel de client societe B
- table dwh_dim_client__societeA => c’est mon référentiel de client societe A
=> Je vais créer une dimension client qui est l’union des 2
Illustration DBT d’union de dimensions
Cas d’un fait :
- une facture, un relevé d’heure, donc un fait, est relié à sa dimension source, pas à sa dimension consolidée. Cela permet une analyse de la source quoi qu’il advienne. Pour la cible, voir le point suivant
Mise en place de dimensions chapeau :
- A partir de tous mes client__* je constitue un dimension dwh_dim_client_unique référencée dans chacune des dimensions sources. Je la dédoublonne sur le siret et le tour est joué.
- En clair, cela permet des rapprochements autant du point de vue consolidé groupe, qu’à la source sur la consolidation entité.
Ces dimensions chapeaux permettent également d’harmoniser des données métiers ( statut d’une commande, type de contrat, etc… )
L’outil DBT permet ce parfait découpage entre données sources et agrégation sur des référentiels fusionnés.
NB : en BI, on a parfois du mal à discerner si un objet doit être une dimension ou un fait. Dans le cadre d’une convergence où les données viennent de plusieurs SI, la dissociation devient plus évidente :
- dimension : on cherche à créer des dimensions chapeau, des regroupements (exemple des clients, des familles de contrats)
- fait : on les cumule, car un fait n’est émis que par un système (lors du switch, on bascule sur l’autre système, mais pas question de regroupements)
Suivi de la convergence
Il est également crucial de suivre la convergence des systèmes au fur et à mesure des migrations. La Modern Data Stack permet de maintenir la cohérence des données pour toutes les entités, qu’elles aient migré vers le nouveau système ou non, grâce à des dimensions chapeau efficaces qui reflètent les états avant et après migration.
Sujet tout aussi intéressant : raccorder un ensemble de données hétérogènes est une chose, s’assurer de la cohérence des données au fur et à mesure que la convergence se concrétise en est une autre.
En clair, pour un objet donné, il y a un avant et un après, mais tous les objets ne convergent pas au même moment. Par exemple, vous ne migrez pas toutes les agences d’une entité vers un nouvel ERP au même moment, il va y avoir des agences pilotes, etc… et éventuellement des lots de migration.
Dans ce mouvement, la plateforme data se doit d’assurer la cohérence des chiffres, que ce soit pour les agences qui n’ont pas migré comme pour les agences qui ont migré. Pour cela, une gymnastique de correspondance va être mise en place, notamment la notion de dimension chapeau, pour par exemple avoir dans le cadre d’une agence : l’agence avant migration, l’agence après migration, et dans une dimension chapeau une seule agence.
Conclusion
L’efficacité de la Modern Data Stack dans le cadre de fusions et acquisitions ne réside pas seulement dans sa capacité à gérer de grands volumes de données ou à intégrer des technologies de pointe, mais également dans son approche stratégique de la modélisation et de la gestion de la donnée.
L’objectif de cet article n’était pas d’expliquer pourquoi des groupes en pleine structuration ont un besoin crucial de data, mais comment les technologies actuelles, alliées à un savoir-faire de modélisation décisionnel, formaient le dispositif idéal pour répondre à ce besoin.
La Modern Data Stack répond parfaitement à ces enjeux.
#datamanagement #fusionsacquisitions #moderndatastack #faitesbrillervosdonnees #effidic
