Présentation et installation de Pentaho

Image non disponible

Ce tutoriel, destiné aux débutants, a pour objectif de vous présenter la plate-forme Pentaho.

Cet article a été initialement publié sur www.osbi.fr.


Commentez Donner une note à l'article (4.5)

Article lu   fois.

L'auteur

Liens sociaux

Viadeo Twitter Facebook Share on Google+   

1. Présentation de Pentaho

Pentaho est une plate-forme décisionnelle open source complète possédant les caractéristiques suivantes :

  • une couverture globale des fonctionnalités de la Business Intelligence :
    • ETL (intégration de données),
    • reporting,
    • tableaux de bord ("Dashboards"),
    • analyse ad hoc (requêtes à la demande),
    • analyse multidimensionnelle (OLAP) ;

Image non disponible

  • Pentaho permet d'adresser deux typologies d'utilisateurs :
    • les « one-clic users », utilisateurs de base, consommateurs d'indicateurs prédéfinis,
    • les utilisateurs avancés, qui ont besoin d'outils d'analyse et d'exploration avancés ;

Image non disponible

  • une architecture Web 2.0 qui se compose :
    • d'un serveur Web J2EE permettant de mettre à disposition l'ensemble des ressources décisionnelles et ceci au travers d'URL Web uniques et standardisées. Le serveur est dénommé "Pentaho User Console" (PUC),
    • plusieurs clients riches permettant la conception et la publication des ressources. Ces derniers sont librement téléchargeables et peuvent être installés sous des environnements Windows, Linux ou Mac-OS (clients Java) ;

Image non disponible

  • le serveur Web Pentaho comporte également une plate-forme d'administration (Pentaho Administration Console) pour la gestion des droits d'accès, la planification d'évènements, la gestion centralisée des sources de données... ;
  • Pentaho est reconnue pour être une solution d'une grande qualité conceptuelle et technique. La plate-forme est orientée « processus » : au travers de « séquences d'actions » on peut ainsi modéliser avec Pentaho des workflows BI avancés ;
  • il n'est pas besoin de connaître JAVA pour travailler avec Pentaho : seule la maîtrise du langage SQL est nécessaire, ainsi que des connaissances de base en XML, HTML et JavaScript. Il faut bien sûr s'autoformer (ou être formé) aux clients de conception ;
  • une communauté importante et très active s'anime autour de Pentaho. Celle-ci contribue au codage de nombreux plugins et de projets communautaires : plugins Kettle, Pentaho Analysis Tool, Pentaho Community Dashboard Framework, etc. ;
  • Pentaho est une suite décisionnelle open source commerciale qui reste très « ouverte ». Les différences fonctionnelles entre la version libre (community edition) et la version payante (enterprise edition) restent limitées. La version libre de Pentaho permet d'installer une plate-forme décisionnelle complète !

2. Téléchargement de Pentaho

Pour débuter avec Pentaho, il est conseillé de télécharger la version community, gratuite et libre d'utilisation. Cette version communautaire peut-être téléchargée sur SourceForge ici :

http://sourceforge.net/projects/pentaho/files.

On y retrouve le serveur Pentaho ("Business Intelligence Server") ainsi que tous les clients de conception (voir détail au paragraphe suivant) :

Image non disponible

Les numéros des versions téléchargées pour les clients de conception et le serveur Pentaho (biserver) doivent toujours être en adéquation : par exemple Pentaho Report Designer 3.0.0 avec Biserver 3.0.0.

Des paquetages d'installation sont disponibles pour tous les systèmes d'exploitation :

  • Windows ;
  • Linux ;
  • Mac.

Image non disponible

3. Liste des clients de conception Pentaho

Outil Code Fonction
Pentaho Report Designer PRD Client de conception de rapports avancés. Il s'agit d'un outil de mise en page similaire à iReport, Eclipse BIRT, Crystal Reports...
Permet de se connecter à de nombreuses sources de données : SGBD, XML, Excel, CSV, flux de données venant de Kettle, MDX (OLAP)...
Pentaho Design Studio PDS Client Eclipse de modélisation de workflows BI (Xactions) propre à Pentaho.
Design Studio permet de mettre en œuvre de nombreuses ressources BI en minimisant l'écriture de code (envoi de mails automatisé par ex.).
Pentaho Metadata PME Client riche permettant la mise en place d'une couche sémantique d'abstraction (métadonnées ) sur la couche physique (tables et colonnes d'une base de données).
Le but est de rendre les objets d'un SGBD compréhensibles et manipulables par un utilisateur final afin de lui permettre d'effectuer ses propres requêtes et ceci sans connaître le langage SQL.
La couche de métadonnées peut-être utilisée dans le requêteur Web ad hoc, dans Pentaho Report Designer et dans Pentaho Design Studio.
Pentaho Schema Workbench PSW Client riche permettant la définition des schémas Mondrian à partir d'un modèle en étoile ou flocon de l'entrepôt de données.
Un autre outil, Pentaho Aggregation Designer (PAD), permet de construire et de charger automatiquement des tables d'agrégation en vue d'améliorer les performances lors du requêtage des cubes Mondrian.
Téléchargement spécifique ici :
http://sourceforge.net/projects/mondrian/files/
Pentaho Data Integration (Kettle) PDI Outil ETL (Extract Transform Load) complet, pouvant être utilisé indépendamment de la plate-forme Pentaho.
Kettle est comparable à Talend Open Studio en termes de fonctionnalités.
Pour consulter les différences techniques et fonctionnelles, un livre blanc est disponible à cette adresse :
http://www.atolcd.com/actualites/detail-actualite/actualite/2/comparatif-etlopen-source-1.html

4. Installation de Pentaho (en local)

Le serveur Pentaho (biserver-ce) est un serveur de démonstration prêt à l'emploi, complètement autonome et pouvant être installé sur un PC bureautique disposant au moins de 1 Go de RAM.

Ce serveur s'appuie notamment sur le système de gestion de base de données Hypersonic (HsqlDb) pour le stockage des données exemples (SampleData) ainsi que des deux bases internes de Pentaho (hibernate et quartz).

HsqlDb étant un système de base de données gérée en mémoire, il est fortement déconseillé de déployer cette configuration en production !

Une fois l'archive téléchargée, il suffit de décompresser celle-ci dans un répertoire préalablement créé, par exemple « C:\Pentaho-3.5.2 » (Windows).

Le répertoire d'installation sera désigné {PENTAHO-HOME} dans la suite de ce document.

Deux répertoires sont créés dans {PENTAHO-HOME} :

  • \biserver-ce : la console Web d'utilisation (Pentaho User Console) ;
  • \administration-console : la console Web pour l'administration de la plate-forme (Pentaho Administration Console).

5. Démarrer & arrêter les serveurs Pentaho

5-A. Pentaho User Console

Les commandes suivantes permettent de lancer et stopper la console d'utilisation Web

Action Commande
Démarrage (Windows) {PENTAHO-HOME}\biserver-ce\start-pentaho.bat
Arrêt (Windows) {PENTAHO-HOME}\biserver-ce\stop-pentaho.bat
Démarrage (Linux) {PENTAHO-HOME}\biserver-ce\start-pentaho.sh
Arrêt (Linux) {PENTAHO-HOME}\biserver-ce\stop-pentaho.sh

On accède à la console d'utilisation Pentaho en saisissant l'URL suivante dans un navigateur Web :

http:\\localhost:8080\pentaho

Puis en saisissant l'identifiant et mot de passe ci-dessous :

  • login : joe ;
  • password : password.

5-B. Pentaho Administration Console

Les commandes suivantes permettent de lancer et stopper la console d'utilisation Web

Action Commande
Démarrage (Windows) {PENTAHO-HOME}\administration-console\start-pac.bat
Arrêt (Windows) {PENTAHO-HOME}\administration-console\stop-pac.bat
Démarrage (Linux) {PENTAHO-HOME}\administration-console\start-pac.sh
Arrêt (Linux) {PENTAHO-HOME}\administration-console\stop-pac.sh

On accède à la console d'administration Pentaho en saisissant l'URL suivante dans un navigateur Web :

http:\\localhost:8099

Puis en saisissant l'identifiant et mot de passe ci-dessous :

  • login : admin ;
  • password : password.

6. Remerciements

Je tiens ici à remercier l'équipe de Developpez.com pour ses relectures attentives et ses suggestions, et en particulier KalyParker, Claude Leloup et jacques_jeanProfil de jacques_jean.

Vous avez aimé ce tutoriel ? Alors partagez-le en cliquant sur les boutons suivants : Viadeo Twitter Facebook Share on Google+   

  

Les sources présentées sur cette page sont libres de droits et vous pouvez les utiliser à votre convenance. Par contre, la page de présentation constitue une œuvre intellectuelle protégée par les droits d'auteur. Copyright © 2012 . Aucune reproduction, même partielle, ne peut être faite de ce site et de l'ensemble de son contenu : textes, documents, images, etc. sans l'autorisation expresse de l'auteur. Sinon vous encourez selon la loi jusqu'à trois ans de prison et jusqu'à 300 000 € de dommages et intérêts.