Les livres sur Pentaho
1 livre et 1 critique, dernière mise à jour le 14 août 2022 , note moyenne : 4
Détails du livre
Sommaire
Critiques (1)
1 commentaire
Pentaho
Mise en place d'une solution Open Source de Business Intelligence
de Christian Vigouroux
Public visé :
Débutant
Résumé de l'éditeur
Ce livre sur Pentaho s'adresse à tout informaticien désireux de mettre en place les principales briques de ce puissant outil de Business Intelligence Open Source. Pour chaque brique de la suite Pentaho détaillée dans le livre (en version 3.6 au moment de l'écriture), une procédure d'installation est décrite en détail. L'auteur propose ensuite une présentation détaillée puis une étude de cas avec de nombreux exemples concrets. Plutôt qu'une étude exhaustive des multiples composants faisant partie de la suite Pentaho, l'option retenue est de mettre l'accent sur les modules principaux en privilégiant une approche par l'exemple.
Dans les premiers chapitres, après une présentation rapide des concepts utilisés en Business Intelligence, l'auteur propose une prise en main rapide de Pentaho (installation de la suite, interfaces d'administration…) accompagnée de nombreux exemples d'utilisation. Des rappels sont ensuite faits sur la modélisation (modèle en étoile, modèle en flocon de neige, cube, dimension, mesure, ...) et sur la construction d'un Datawarehouse. Les fonctionnalités de l'ETL Pentaho Data Integration sont listées et de nombreuses transformations sont analysées. L'auteur décrit le générateur de rapports Adhoc (WAQR) toujours au travers d'exemples.
Une partie importante du livre est consacrée au puissant générateur de rapports et de graphes Pentaho Report Designer, illustrée là encore par de nombreux exemples. Un autre volet conséquent est dédié à la modélisation et à l'exploitation de cubes de données multidimensionnelles. Mondrian (moteur multidimensionnel), MDX (langage de manipulation de données multidimensionnelles), JPivot (interface de restitution des résultats) et Pentaho Schema Workbench (assistance à la modélisation) sont détaillés. Le module Pentaho Aggregator Designer vient optimiser l'exploitation des données sous Mondrian en réalisant des agrégations. Le module Pentaho Design Studio (PDS), servant à l'installation des développements réalisés (transformations, analyses, rapports, ...) sur le serveur Web Pentaho est aussi largement commenté.
L'auteur met également en avant l'interopérabilité de la suite Pentaho avec des briques Open Source tierces, comme le générateur de rapports BIRT. Le puissant outil de Data Mining Weka, désormais intégré dans la suite Pentaho, et qui permet l'analyse des données au travers de multiples algorithmes est traité. L'auteur décrit la gestion des métadonnées via Pentaho Metadata Editor qui rend l'exploitation des données plus aisée dans les différents modules de la suite Pentaho par la création de vues métier. L'ensemble des exemples et les jeux de données nécessaires sont en téléchargement sur le site www.editions-eni.fr.
Dans les premiers chapitres, après une présentation rapide des concepts utilisés en Business Intelligence, l'auteur propose une prise en main rapide de Pentaho (installation de la suite, interfaces d'administration…) accompagnée de nombreux exemples d'utilisation. Des rappels sont ensuite faits sur la modélisation (modèle en étoile, modèle en flocon de neige, cube, dimension, mesure, ...) et sur la construction d'un Datawarehouse. Les fonctionnalités de l'ETL Pentaho Data Integration sont listées et de nombreuses transformations sont analysées. L'auteur décrit le générateur de rapports Adhoc (WAQR) toujours au travers d'exemples.
Une partie importante du livre est consacrée au puissant générateur de rapports et de graphes Pentaho Report Designer, illustrée là encore par de nombreux exemples. Un autre volet conséquent est dédié à la modélisation et à l'exploitation de cubes de données multidimensionnelles. Mondrian (moteur multidimensionnel), MDX (langage de manipulation de données multidimensionnelles), JPivot (interface de restitution des résultats) et Pentaho Schema Workbench (assistance à la modélisation) sont détaillés. Le module Pentaho Aggregator Designer vient optimiser l'exploitation des données sous Mondrian en réalisant des agrégations. Le module Pentaho Design Studio (PDS), servant à l'installation des développements réalisés (transformations, analyses, rapports, ...) sur le serveur Web Pentaho est aussi largement commenté.
L'auteur met également en avant l'interopérabilité de la suite Pentaho avec des briques Open Source tierces, comme le générateur de rapports BIRT. Le puissant outil de Data Mining Weka, désormais intégré dans la suite Pentaho, et qui permet l'analyse des données au travers de multiples algorithmes est traité. L'auteur décrit la gestion des métadonnées via Pentaho Metadata Editor qui rend l'exploitation des données plus aisée dans les différents modules de la suite Pentaho par la création de vues métier. L'ensemble des exemples et les jeux de données nécessaires sont en téléchargement sur le site www.editions-eni.fr.
Édition : ENI - 532 pages, 1re édition, 1er avril 2011
ISBN10 : 2746063301 - ISBN13 : 9782746063303
- Introduction : présentation de Pentaho
- Chapitre 1 : Prise en main rapide de Pentaho
- Chapitre 2 : Exemples Pentaho
- Chapitre 3 : Modélisation en Informatique Décisionnelle
- Chapitre 4 : Présentation de l'ETL PDI
- Chapitre 5 : Mise en œuvre de PDI
- Chapitre 6 : Présentation de WAQR
- Chapitre 7 : Mise en oeuvre de WAQR
- Chapitre 8 : Présentation de PRD
- Chapitre 9 : Mise en oeuvre de PRD
- Chapitre 10 : Présentation de Mondrian/JPivot
- Chapitre 11 : Mise en oeuvre de Mondrian/JPivot
- Chapitre 12 : Modélisation Mondrian via PSW
- Chapitre 13 : Agrégation de données via PAD
- Chapitre 14 : Intégration des composants via PDS
- Chapitre 15 : Intégration de rapports BIRT
- Chapitre 16 : Analyse de données via Weka
- Chapitre 17 : Gestion des métadonnées via PME
- Glossaire OLAP
Ce livre composé de 17 chapitres va vous permettre de découvrir la plate-forme BI Pentaho.
Après une courte présentation de la plate-forme, le chapitre 1 vous guidera dans l'installation et la prise en main du produit. Le chapitre 2 vous fera entrer dans le vif du sujet en vous faisant manipuler quelques exemples de rapports. Le chapitre 3, plus théorique, vous présentera les bases du SQL, ainsi qu'une explication sur la modélisation utilisée en décisionnel. Dans les deux chapitres suivants, vous découvrirez et utiliserez l'outil de chargement de données : Pentaho Data Integration. Les chapitres 6, 7, 8 et 9 vous présenteront les outils de création de rapport disponibles sur la console utilisateur et en client lourd. Le chapitre 10 vous présentera Mondrian et JPivot. Le chapitre 11 est un savant mélange de théorie et de pratique pour vous faire découvrir la modélisation de cube et le langage permettant de les utiliser : le MDX. Les chapitres suivants vous présenteront les autres clients lourds de la suite Pentaho : création d'agrégats, création d'actions, data-mining et définition d'une couche métier pour les rapports. Le chapitre 15 sort du cadre de la présentation de Pentaho en expliquant comment intégrer des rapports Birt à la suite.
Bien que ce livre présente la plate-forme Pentaho Open source dans sa version 3.6, vous pouvez tout aussi bien appliquer les exemples du livre sur une version plus récente, seuls quelques exemples du chapitre 2 ne seront pas disponibles. Notez toutefois que dans la version 4, un avertissement apparaîtra sur les modules WAQR et JPivot. En effet, ces deux composants disparaîtront prochainement, mais seront bien entendu remplacés par des composants équivalents.
Pour tous ceux qui démarrent dans le monde du décisionnel, les explications sur la modélisation des cubes Mondrian et l'apprentissage progressif du langage MDX devraient vous permettre de démarrer sereinement dans votre aventure BI. Tous les outils de la suite Pentaho sont présentés de façon à ce que vous compreniez bien à quoi sert chaque module, notez toutefois que ce livre est essentiellement destiné à des informaticiens.
Pour finir, il aurait été intéressant d'avoir une brève comparaison des fonctionnalités de la suite Open source et de la version Enterprise.
Après une courte présentation de la plate-forme, le chapitre 1 vous guidera dans l'installation et la prise en main du produit. Le chapitre 2 vous fera entrer dans le vif du sujet en vous faisant manipuler quelques exemples de rapports. Le chapitre 3, plus théorique, vous présentera les bases du SQL, ainsi qu'une explication sur la modélisation utilisée en décisionnel. Dans les deux chapitres suivants, vous découvrirez et utiliserez l'outil de chargement de données : Pentaho Data Integration. Les chapitres 6, 7, 8 et 9 vous présenteront les outils de création de rapport disponibles sur la console utilisateur et en client lourd. Le chapitre 10 vous présentera Mondrian et JPivot. Le chapitre 11 est un savant mélange de théorie et de pratique pour vous faire découvrir la modélisation de cube et le langage permettant de les utiliser : le MDX. Les chapitres suivants vous présenteront les autres clients lourds de la suite Pentaho : création d'agrégats, création d'actions, data-mining et définition d'une couche métier pour les rapports. Le chapitre 15 sort du cadre de la présentation de Pentaho en expliquant comment intégrer des rapports Birt à la suite.
Bien que ce livre présente la plate-forme Pentaho Open source dans sa version 3.6, vous pouvez tout aussi bien appliquer les exemples du livre sur une version plus récente, seuls quelques exemples du chapitre 2 ne seront pas disponibles. Notez toutefois que dans la version 4, un avertissement apparaîtra sur les modules WAQR et JPivot. En effet, ces deux composants disparaîtront prochainement, mais seront bien entendu remplacés par des composants équivalents.
Pour tous ceux qui démarrent dans le monde du décisionnel, les explications sur la modélisation des cubes Mondrian et l'apprentissage progressif du langage MDX devraient vous permettre de démarrer sereinement dans votre aventure BI. Tous les outils de la suite Pentaho sont présentés de façon à ce que vous compreniez bien à quoi sert chaque module, notez toutefois que ce livre est essentiellement destiné à des informaticiens.
Pour finir, il aurait été intéressant d'avoir une brève comparaison des fonctionnalités de la suite Open source et de la version Enterprise.
Commenter Signaler un problème
Bonjour
La rédaction de DVP a lu pour vous l'ouvrage suivant:
Pentaho - Mise en place d'une solution Open Source de Business Intelligence de Christian Vigouroux
paru aux Editions ENI
L'avez-vous lu ? Comptez-vous le lire bientôt ?
Quel est votre avis ?
Exprimez-vous !! Votre avis nous intéresse...
La rédaction de DVP a lu pour vous l'ouvrage suivant:
Pentaho - Mise en place d'une solution Open Source de Business Intelligence de Christian Vigouroux
paru aux Editions ENI
Consultant de haut niveau et toujours très impliqué sur les forums Essbase, Cameron Lackpour nous livre un ouvrage unique destiné aux utilisateurs Essbase avancés ainsi qu'aux plus experts. Grand spécialiste d'Essbase, de Planning et d'ODI (Oracle Data Integrator), il s'est entouré de douze experts pour traiter les sujets et les problématiques phares tels que l'infrastructure, l'implémentation et la gestion d'un projet Essbase, les questions d'alimentation et d'analyse, les dessous des deux grandes typologies de stockage ASO et BSO et finalement les techniques de développement et d'automatisation avec l'API Java et le langage Groovy.
Cet ouvrage peut se lire de bout en bout ou se prêter à des consultations ponctuelles à travers un vaste index. De nombreux tableaux récapitulatifs et des synthèses de fin de chapitre contribuent à en faire un livre agréable à consulter. Bien qu'un bon niveau d'anglais soit requis pour en saisir toutes les subtilités, je ne peux que recommander cet ouvrage qui renferme et concentre une mine d'informations.
Le chapitre consacré à l'infrastructure comprend de nombreux conseils dédiés au dimensionnement et à la répartition des différentes briques, qu'il s'agisse de composants de type hardware (CPU, RAM, disques embarqués ou SAN) ou logiciel (serveur applicatif, serveur Web, base de données).
L'auteur en personne traite ensuite des risques liés à la qualité de la donnée et de l'utilité d'un ETL (Extract, Transform, Load), Oracle Data Integrator (ODI) en l'occurrence qui se marie très bien avec Essbase. De nombreux exemples de scripts illustrent les techniques de comparaison, de chargement, de contrôle et de validation des données à partir d'ODI.
Le chapitre suivant, sur les cubes BSO (Block Storage Option), explore et démystifie les pistes d'optimisation d'outline et de script de calcul à grand renfort d'exemples.
Une série de trois chapitres est dédiée aux cubes ASO (Agregate Storage Option) dont l'intérêt n'est plus à démontrer. Le premier détaille le positionnement des cubes ASO, la démarche de migration d'une typologie BSO vers une typologie ASO et leur utilisation conjointe. Le deuxième chapitre porte sur le langage MDX (Multidimensional Expressions), langage de requête et de calcul. Enfin le dernier chapitre de cette série décrit de façon inédite les arcanes du moteur ASO et les règles d'optimisation à considérer lors de tout développement.
Un chapitre expose de façon détallée l'API Java d'Essbase et est illustré de nombreux exemples et de bouts de code largement disséqués et commentés. Ce chapitre permet d'ailleurs d'appréhender le chapitre suivant, dédié à l'automatisation des traitements à partir de l'utilisation du langage de script Groovy se mariant très bien avec le langage Java.
Cet ouvrage peut se lire de bout en bout ou se prêter à des consultations ponctuelles à travers un vaste index. De nombreux tableaux récapitulatifs et des synthèses de fin de chapitre contribuent à en faire un livre agréable à consulter. Bien qu'un bon niveau d'anglais soit requis pour en saisir toutes les subtilités, je ne peux que recommander cet ouvrage qui renferme et concentre une mine d'informations.
Le chapitre consacré à l'infrastructure comprend de nombreux conseils dédiés au dimensionnement et à la répartition des différentes briques, qu'il s'agisse de composants de type hardware (CPU, RAM, disques embarqués ou SAN) ou logiciel (serveur applicatif, serveur Web, base de données).
L'auteur en personne traite ensuite des risques liés à la qualité de la donnée et de l'utilité d'un ETL (Extract, Transform, Load), Oracle Data Integrator (ODI) en l'occurrence qui se marie très bien avec Essbase. De nombreux exemples de scripts illustrent les techniques de comparaison, de chargement, de contrôle et de validation des données à partir d'ODI.
Le chapitre suivant, sur les cubes BSO (Block Storage Option), explore et démystifie les pistes d'optimisation d'outline et de script de calcul à grand renfort d'exemples.
Une série de trois chapitres est dédiée aux cubes ASO (Agregate Storage Option) dont l'intérêt n'est plus à démontrer. Le premier détaille le positionnement des cubes ASO, la démarche de migration d'une typologie BSO vers une typologie ASO et leur utilisation conjointe. Le deuxième chapitre porte sur le langage MDX (Multidimensional Expressions), langage de requête et de calcul. Enfin le dernier chapitre de cette série décrit de façon inédite les arcanes du moteur ASO et les règles d'optimisation à considérer lors de tout développement.
Un chapitre expose de façon détallée l'API Java d'Essbase et est illustré de nombreux exemples et de bouts de code largement disséqués et commentés. Ce chapitre permet d'ailleurs d'appréhender le chapitre suivant, dédié à l'automatisation des traitements à partir de l'utilisation du langage de script Groovy se mariant très bien avec le langage Java.
L'avez-vous lu ? Comptez-vous le lire bientôt ?
Quel est votre avis ?
Exprimez-vous !! Votre avis nous intéresse...
Bonjour
J'ai acheté et lu cet ouvrage il y a presque un an maintenant.
C'est un bon ouvrage pour des débutants sur Pentaho, qui n'ont encore jamais manipulé les outils et la plate-forme
Ceux qui connaissent déjà Pentaho seront sans doute un peu frustrés, je leur conseille plutôt le livre "Pentaho Solutions: Business Intelligence and Data Warehousing With Pentaho and Mysql" (en anglais)
Pour plus de détails, retrouvez une revue plus détaillée du livre de Christian Vigouroux ici: http://www.osbi.fr/?p=2415
J'ai acheté et lu cet ouvrage il y a presque un an maintenant.
C'est un bon ouvrage pour des débutants sur Pentaho, qui n'ont encore jamais manipulé les outils et la plate-forme
Ceux qui connaissent déjà Pentaho seront sans doute un peu frustrés, je leur conseille plutôt le livre "Pentaho Solutions: Business Intelligence and Data Warehousing With Pentaho and Mysql" (en anglais)
Pour plus de détails, retrouvez une revue plus détaillée du livre de Christian Vigouroux ici: http://www.osbi.fr/?p=2415