F.A.Q. Business Intelligence
F.A.Q. Business IntelligenceConsultez toutes les FAQ
Nombre d'auteurs : 1, nombre de questions : 20, création le 3 octobre 2013
- Quelle est la différence entre un datawarehouse et un datamart ?
- Quelle est la différence entre un datawarehouse et un cube ?
- Quel est le lien entre le datawarehouse, les datamarts et le cube ?
- Un datamart contient-il une seule table de faits ?
- L'œuf et la poule - Que faire en premier, le datawarehouse ou le datamart ?
- Un datamart est-il en étoile ? Agrégé ?
Le datamart est un sous-ensemble du datawarehouse. Le datawarehouse concentre toutes les données de l'entreprise, alors que le datamart est spécialisé pour une direction, un métier ou un thème précis.
On peut par exemple trouver des datamarts Marketing, RH comme des datamarts Ventes, Stock, etc.
Un datawarehouse est l'endroit où on va stocker et consolider toutes les informations de l'entreprise. C'est généralement une base de données classique.
Un cube est un stockage spécifique des données pour répondre aux problématiques OLAP, notamment sur les temps de réponse.
Le cube va stocker en fait tous les précalculs d'agrégation sur une table de faits, en totalité (MOLAP) ou partiellement.
Par exemple, si on a une table de faits liée uniquement aux dimensions ville et jour, le cube va stocker les résultats à tous les niveaux possibles :
(avec une ville est rattachée à une région qui est rattachée à un pays et un jour appartient à une semaine qui appartient à un mois qui appartient à une année)
- ville x jour
- ville x semaine
- ville x mois
- ville x année
- région x jour
- région x semaine
- région x mois
- région x année
- pays x jour
- pays x semaine
- pays x mois
- pays x année
Là où dans le datawarehouse on ne stockait que le détail des données, le cube va stocker tous les agrégats et les précalculs possibles. Cela permet de donner des temps de réponse instantanés, car tout est précalculé.
Le cube est un stockage des données spécifique pour répondre aux problématiques OLAP. Il vient en aval du datawarehouse et du datamart stockés et générés dans une base de données classique ; une fois constitué le datamart sera déchargé dans un cube. Ainsi les utilisateurs pourront analyser rapidement les données en OLAP via le cube, ce qu'ils n'auraient pu faire dans une base de données classique.
Non, un datamart peut contenir plusieurs tables de faits.
Une seule table de faits est préférable pour ne pas avoir à gérer plusieurs requêtes SQL lors de l'interrogation des données, mais ce n'est pas obligatoire.
Cela dépend des auteurs !
Si on écoute les gourous en la matière, Ralph Kimball préconise de commencer par les datamarts, qui assemblés formeront le datawarehouse (approche bottom-up).
Bill Inmon lui définit le datawarehouse d'abord et le prend comme base pour construire les datamarts (approche top-down).
Le datamart est modélisé en étoile ou en flocons, ce qui est la modélisation classique en décisionnel.
Par contre le fait qu'il soit agrégé ou non dépend des auteurs. Selon Ralph Kimball, il contient des tables au détail et des tables agrégées pour une question de performance.
Selon Bill Inmon, c'est une vue agrégée du datawarehouse.