IV-D. Comparatif des temps de traitements▲
IV-D-1. Méthodologie de réalisation des tests▲
Les performances des temps de traitements sont un critère important dans le choix d'un ETL.
Les résultats des tests qui sont donnés dans les paragraphes suivants correspondent à des cas simples et ne peuvent en aucun cas préjuger des performances réelles en environnement de production.
Seuls des tests poussés sur des traitements d'intégration réels peuvent permettre de qualifier définitivement l'ETL choisi.
- L'ensemble des tests ont été effectués sur un PC Portable Dell
Les caractéristiques techniques sont les suivantes :

- Les versions utilisées des 2 ETL sont les suivantes:
- Pentaho Data Integration v3.0.1
- Talend Open Studio v2.2.3
- Pour chaque test, les résultats présentés sont issu d'une moyenne de trois essais réalisés dans des conditions identiques.
- Tous les traitements sont lancés en ligne de commande.
Ainsi, aucun essai n'est lancé depuis les interfaces graphiques aussi bien pour Pentaho Data Integration que Talend Open Studio.
- Enfin, les essais sont réalisés uniquement en code généré en Java pour Talend Open Studio, afin que l'on puisse comparer de façon objective ceux obtenus avec Pentaho Data Integration, dont le moteur est écrit en Java.
IV-D-2. Test n°1▲
Descriptif | 1. Extraction des données d'un fichier CSV |
2. Chargement des données dans un autre fichier CSV | |
- Le séparateur « ; » du fichier initial est remplacé par le séparateur « , ». | |
Détails | Le fichier d'entrée comporte 7 champs typés |
sequence [integer]; now [datetime]; first [number]; second [string]; third [datetime]; fourth | |
[boolean]; fifth [integer] | |
0000000001;2007/11/0510:44:43.014;12.345;undeuxtroisquatrecinq;0304/12/0500:00:00.000;Y;12345 | |
0000000002;2007/11/0510:44:43.029;12.345;undeuxtroisquatrecinq;0304/12/0500:00:00.000;Y;12345 | |
0000000003;2007/11/0510:44:43.029;12.345;undeuxtroisquatrecinq;0304/12/0500:00:00.000;Y;12345 | |
0000000004;2007/11/0510:44:43.029;12.345;undeuxtroisquatrecinq;0304/12/0500:00:00.000;Y;12345 | |
0000000005;2007/11/0510:44:43.029;12.345;undeuxtroisquatrecinq;0304/12/0500:00:00.000;Y;12345 | |
0000000006;2007/11/0510:44:43.029;12.345;undeuxtroisquatrecinq;0304/12/0500:00:00.000;Y;12345 | |
0000000007;2007/11/0510:44:43.029;12.345;undeuxtroisquatrecinq;0304/12/0500:00:00.000;Y;12345 | |
0000000008;2007/11/0510:44:43.029;12.345;undeuxtroisquatrecinq;0304/12/0500:00:00.000;Y;12345 | |
0000000009;2007/11/0510:44:43.029;12.345;undeuxtroisquatrecinq;0304/12/0500:00:00.000;Y;12345 | |
0000000010;2007/11/0510:44:43.029;12.345;undeuxtroisquatrecinq;0304/12/0500:00:00.000;Y;12345 | |
etc. | |
Modélisation dans Pentaho Data Integration (PDI) | ![]() |
Modélisation dans Talend Open Studio | ![]() |
Résultats du Test | ![]() |
(Temps de traitement exprimés en sec.) |
IV-D-3. Test n°2▲
IV-D-4. Test n°3▲
Descriptif | 1. Extraction des données d'un fichier CSV |
2. Chargement des données dans une table Postgresql | |
Détails | Le fichier d'entrée comporte 7 champs typés (même fichier que Test 1 et 2) |
La table Postgresql chargée comporte les champs suivants : | |
![]() |
|
Modélisation dans Pentaho Data Integration (PDI) | ![]() |
Modélisation dans Talend Open Studio | ![]() |
Résultats du Test | ![]() |
(Temps de traitement exprimés en sec.) |
IV-D-5. Test n°4▲
IV-D-6. Test n°5▲
IV-D-7. Test n°6▲
IV-D-8. Test n°7▲
Descriptif | Utilisation d'une étape de traitement « Dimension lente » de type 2 |
Pour plus d'infos sur les différents types de « Slow Changing Dimension » consulter la page : | |
http://en.wikipedia.org/wiki/Slowly_changing_dimension | |
Détails | La table [produits_ref_scd] permet l'historisation des prix d'un catalogue produit. |
Extrait de la table avant le traitement : | |
![]() |
|
Le fichier traité indique le code et le prix de l'article à la date du traitement : | |
100; 746.48 | |
101; 528.72 | |
Une fois le traitement effectué, la table [produits_ref_scd] stocke l'historique des prix : | |
![]() |
|
Pour un code produit donné, dès que le prix est différent de celui présent en base, un nouvel enregistrement est créée avec un nouveau numéro de version. La période de validité est également mise à jour (date_debut, date_fin) | |
Modélisation dans Pentaho Data Integration (PDI) | ![]() |
Modélisation dans Talend Open Studio | ![]() |
Résultats du Test | ![]() |
(Temps de traitement exprimés en sec.) |