DBT (Data Build Tool)

Créé par Fishtown Analytics, Data Build Tool permet aux spécialistes de transformer leurs données au sein-même de leur entrepôt de données

L’emploi du langage SQL fait de DBT un outil simple d’utilisation et facilement accessible aux « data analyst ».

DBT génère une documentation automatisée des transformations dans le DWH, qui peut être mise facilement à disposition des métiers via un serveur web.

DBT est proposé en Open Source et en cloud, ce qui permet d’accroître largement la productivité lors de son utilisation

Cet outil permet de structurer l’ensemble des transformations SQL du projet DATA/BI.

Le SQL est le langage de prédilection lorsqu’il s’agit de manipuler de la donnée. Son retour en force témoigne de sa puissance, sa pertinence lorsque l’on traite la donnée. Porté par des plateformes cloud qui le mette en avant, il est le langage indispensable lorsque l’on veut mettre en place un entrepôt de données.

L’outil DBT est parti de ce paradigme et, plutôt que d’abstraire ce langage en des boîtes « drag and drop » plus ou moins sophistiquées et complexes, il a pris le parti de structurer l’écriture de ce langage pour en dégager toute sa puissance.

Lorsque l’on utilise DBT, on écrit ni plus ni moins des « SELECT » en SQL. DBT se charge de les matérialiser en vues, en tables, et de faire le lien entre toutes les requête « SELECT » qui auront été écrites. Les 3 gros intérêts de DBT :

  1. Être capable d’exécuter les instructions SQL, dans l’ordre, à partir de tout le SQL qui aura été écrit (en passant bien sûr, détecter les boucles éventuelles qui auront été écrites par un développeur distrait…)
  2. Générer une documentation vivante, des transformations qui ont lieu dans le DWH
  3. Faciliter les études d’impact, grâce aux graphes de dépendances des tables qui sont générés avec la documentation