Data Engineer

GreenFlex recrute !

À propos

Nous aidons les organisations à changer de trajectoire en se transformant sur le plan environnemental, énergétique et sociétal. Notre raison d'être ? Construire une économie qui crée et préserve plus qu’elle ne détruit.

Notre modèle est basé sur la multi expertise :

  • Conseil-environnemental et sociétal
  • Mise en œuvre de projets de performance énergétique et bas-carbone
  • Financement de la transition
  • Plateforme digitale de pilotage des plans d’actions

Face aux urgences environnementales et sociétales, ce modèle nous permet aujourd'hui d’accélérer la transition de nos 800 clients et plus encore demain.

Descriptif du poste

GreenFlex recherche un Data Engineer pour participer à l’accompagnement des clients internes et grands comptes dans la réduction de leur empreinte énergétique et environnementale à travers des projets analytics.

MISSIONS ET RESPONSABILITÉS :

Au sein d’une équipe digitale organisée en squads « agile » avec une forte culture devops, membre du Chapter Data Analytics, vous travaillerez sur l’industrialisation des modèles de Machine Learning sur la plateforme Greenflex IQ, plateforme dédiée à l’accélération de la transition environnementale de ses clients (énergie, développement durable, RSE, financement, …).
Vous aurez la possibilité de travailler sur un environnement à haut niveau technique (AWS, Databricks, MLflow, Qlik, DataDog, Gitlab, librairies Python notamment de Data Science).

Vous serez principalement amené(e) à travailler sur des sujets orientés analyse de données et modélisation qui consisteront à :

• Participer à la poursuite de la mise en place et à la maintenance des outils MLOps de la plateforme (model registry, model serving, model monitoring, automatisation, metadata handling, features store, etc.)
• Contribuer à la conception et aux développements des nouveaux produits analytics de la plateforme, en appliquant les « best practices » du génie logiciel
• Assurer la maintenance des produits analytics
• Alimenter et maintenir les documentations techniques

Vous participerez à l’élaboration d’algorithmes de traitement, d’analyses de données et modèles d’apprentissage automatique avancés : réseaux de neurones, clustering, régression logistique, PCA…

Vous serez immergé dans les problématiques métiers des équipes de management de l’énergie sur des secteurs d’activité tel que le retail, l’industrie ou encore sur des problématiques d’ENR

Profil recherché

− Grandes écoles d’ingénieur ou université avec une majeur ou spécialisation en mathématiques appliquées, statistiques ou big data analytics.
− Expérience professionnelle exigée : 4 ans en tant qu’ingénieur de données, et ayant participer à l’architecture et la réalisation de flux d’acquisition, d’ingestion, de préparation et de traitements de données (distribués ou non)

COMPETENCES TECHNIQUES :

− Maitrise d’un langage de programmation, tel que Python, Pyspark est obligatoire
− Maitrise développement en Spark sur l’environnement Databricks / module Delta est obligatoire
− Connaissances DevOps et GitOps
− Connaissances en base de données tels que : SQL, InfluxDB, Spark, RDBMS
− Maitrise d’API tel que Graph QL serait appréciable
− Bonne maitrise d’Excel et de PowerPoint
− Bonne connaissance des enjeux environnementaux et IT
− Une connaissance des méthodes d’explicabilité des modèles de Machine Learning (XAI) serait un plus

APTITUDES :

• Esprit Engineering et Génie logiciel
• Bon niveau d’anglais
• Méthodologies Agile
• Une connaissance du secteur du développement durable et/ou de l’énergie serait un plus

SAVOIR ETRE :

− Communication orale et écrite claire
− Sens du service
− Qualité d’écoute et de pédagogie
− Esprit de collaboration
− Autonomie
− Rigueur

Informations complémentaires

  • Type de contrat : CDI
  • Lieu : Paris
  • Niveau d'études : Bac +5 / Master
  • Expérience : > 4 ans