Je suis mandatée par une startup pour les aider à recruter leur second Data Engineer.
Voici quelques éléments de contexte :
Fondée en 2018, autofinancée, qui génère du revenu donc stable/fiable
L'entreprise développe un SaaS d'aide à la décision et d'analyse de risques
L'équipe data est actuellement constituée de 4 collaborateurs (3 data scientist, 1 data engineer) + 1 devops.
Localisés en plein paris, 3 jours de télétravail par semaine
Anglais professionnel mandatory (clients étrangers + équipes internes qui parlent anglais)
En tant que Data Engineer, vous aurez pour missions de :
Prendre en charge les données de leur arrivée jusqu'à leur restitution :
Check de la qualité
Ingestion
Traitement des données
Agrégation
Calcul des métriques
Extraire
Charger
Restituer les analyses de données
Orchestration, Automatisation et planification des workflows
Optimiser les jobs : Amélioration continue des performances, réduction des coûts, scalabilité.
Automatisation
Monnitoring
Continuer le scaling de la plateforme : Adapter l’architecture pour gérer l’augmentation de la volumétrie.
Être force de proposition, ne pas être dans l'exécution
Profil recherché :
Vous disposez d'une formation en informatique, data engineering
Vous avez + de 4 ans d'expérience en tant que Data Engineer
Maîtrise des outils et langages (GCP, Spark, Iceberg, Airflow, Python, ETL/ELT... ou équivalents)
Vous avez déjà conçu (ou contribué à concevoir) des architectures, et êtes intervenu sur le design (pas uniquement sur de l'implémentation).
Vous devez comprendre pourquoi vous réalisez les choses, proposer une stack, définir comment vous allez la mettre en place en fonction des problématiques rencontrées)
Vous avez déjà travaillé en mode distribué, sur de volumes importants de données, du passage à l'échelle (être force de proposition et opérationnel)
Vous avez déjà travaillé avec iceberg (ou équivalent), technos lake house, traitement de fichier plat/meta data
Vous êtes à l'aise pour communiquer en anglais (lu, écrit, parlé)