Travail chez Talend
Par Pierrick, lundi 6 novembre 2006 à 12:48 / categorie: General / tags: / #89 / rss
Voilà maintenant près de 5 mois que je travaille chez Talend. J'ai volontairement attendu quelques mois et notamment la fin de ma période d'essai pour évoquer ce nouveau travail sur mon blog.
Talend est un éditeur logiciel. Un éditeur de logiciel opensource. Un éditeur de logiciel opensource dont une partie des développements se fait en Perl. Résumées en ces 3 idées, voilà les raisons qui m'ont motivé à rejoindre cette jeune entreprise innovante. C'est grâce à une levée de fonds réalisées par Talend que ma belle-soeur journaliste financière m'a transmis des infos sur l'entreprise et surtout l'annonce de recherche d'un développeur Perl expérimenté. L'annonce était parue sur le site des mongueurs de Perl francophones.
Le logiciel que nous éditons est un ETL acronyme d'Extract, Transform & Load (extraction, transformation et chargement). Ce type de logiciel est principalement lié à une utilisation en entreprise car un ETL est généralement utile pour traiter d'importants volumes de données. Notre objectif est de mettre l'ETL à portée de toutes les entreprises qu'elles soient grandes ou petites. En effet, les principales solutions actuelles sur la marché sont des solutions propriétaires et très chères.
Avec Talend Open Studio, l'utilisation est complètement gratuite, des outils communautaires sont disponibles pour obtenir du support gratuit. Pour ceux qui me connaissent, il peut sembler un peu paradoxal que je mette en avant la gratuité du logiciel alors que son énorme avantage est en réalité sa liberté (opensource). J'insiste sur la gratuité car l'ETL est un outil pour les entreprises et que pour elles, le prix est un critère déterminant... en 2006 en tout cas. Dans quelques années, le critère opensource pesera certainement de plus en plus lourd dans les choix logiciels par les directions informatiques. Pour le moment, le pragmatisme est nécessaire et la gratuité est importante.
Talend Open Studio est donc l'ETL édité par Talend. Nous utilisons 2 technologies : Java et Perl.
- Java et plus particulièrement Eclipse RCP, une plateforme pour développer des clients lourds, sont utilisés pour l'interface graphique. Je ne suis personnellement pas vraiment fan de Java, mais je dois avouer que l'interface graphique "Eclipse-like" est réellement agréable à utiliser et plus simplement, elle est belle
- Perl est utilisé pour le traitement des données, c'est Perl qui s'occupe de l'extraction, la transformation et le chargement des données. Ce choix est motivé par la richesse de la bibliothèque de modules CPAN, qui contient un grand nombre de connecteurs à diverses sources de données. De plus, Perl excelle dans le traitement des données textuelles, grâce à une syntaxe souple, puissante et concise et à des mécanisme standard commes les expressions régulières.
Le principe de Talend Open Studio est de proposer une palette de composants que l'utilisateur va sélectionner et lier dans un job. Toute la conception des jobs est réalisée dans l'interface graphique, du choix des composants, à leurs liens en passant par le paramétrage de chacun. Une fois le job conçu, Talend Open Studio génère un script Perl indépendant qui exécutera le travail prévu dans le job.
Mon rôle chez Talend consiste d'une part à rechercher le meilleur modèle de génération de code Perl possible, à concevoir et développer les composants, d'autre part à faire bénéficier Talend de mon expérience dans le domaine de l'édition de logiciel libre.
Commentaires
1. Le mercredi 15 novembre 2006 à 23:41, par niklos
2. Le jeudi 30 novembre 2006 à 17:31, par Flipflip
Ajouter un commentaire
Les commentaires pour ce billet sont fermés.