Sept. 2024
Présent
Présent
Ingénieur des données (Apprenti)
BNP Paribas CIB
Paris, France
- Collecte et traitement de données ESG pour 10+ providers via 10+ pipelines dédiés : centaines de datasets/provider, grands volumes, traitement réduit de plusieurs heures à une dizaine de minutes ; un poste temps plein en traitement manuel devenu ~1 journée de monitoring.
- Contribution à la plateforme data pour l'intégration et la livraison de données vers les datalakes clients avec Airflow, Step Functions, Lambda, S3, Glue et Apache Iceberg.
- Industrialisation de près de 400 indicateurs ESG avec dbt.
- Construction et maintenance d'objets Snowflake et de workloads SQL pour les analyses ESG ; amélioration de la perf SQL sur jointures lourdes et agrégations récurrentes.
- Construction d'une bibliothèque interne de connecteurs Python (SFTP/Paramiko, API internes, Microsoft Graph, AWS) et scripts bash de bootstrap d'environnement ; onboarding 1 journée → 1 min pour les nouveaux arrivants dans l'équipe.
- Livraison d'outillage ad-hoc Python/SQL pour produit et sales afin d'accélérer les livrables clients.
- Développement backend et scripts par cas d'usage exécutés sur CircleCI pour manipuler des données sur DynamoDB et PostgreSQL.
- Construction de CLIs Rust/Python pour interagir avec des API internes et accélérer les besoins métiers.
- Automatisation de la documentation technique à partir du lineage dbt.
- Adoption d'un développement piloté par specs avec agents IA et skills réutilisables sur les features pipelines et dbt.
- Déploiement d'un chatbot client (AWS Bedrock, Chainlit) en self-service sur jeux de données ESG sélectionnés.
- Publication d'une vingtaine de types de tableaux de bord QuickSight multi-clients avec templates réglementaires et métier ; collaboration avec analystes ESG sur ESG KPIs, backlog et tests de data quality.