
FinTech leader en France pour les logiciels dédiés aux métiers du patrimoine et de la finance, HARVEST accompagne les professionnels avec des solutions couvrant toute la chaîne de valeur patrimoniale et financière depuis 35 ans. Le groupe conçoit des solutions digitales, rend accessible l’information indispensable pour éclairer les décisions patrimoniales et financières. Spécialiste de la data, il permet la construction automatisée de portefeuilles efficients sur mesure.
Avec plus de 4600 sociétés clientes, le groupe propose un ensemble de logiciels et de services plébiscités par les professionnels désireux de développer un conseil à forte valeur ajoutée.
Expertise métier et maîtrise technologique s’exercent avec plus de 600 talents passionnés et investis. Le groupe a recruté plus de 100 collaborateurs en France en 2024 pour accompagner sa croissance et son ambition de devenir le champion européen de la WealthTech.
Vous rejoignez l’équipe Data / IA / Engineering, rattachée au Chief AI Officer, pour concevoir, implémenter et industrialiser des fonctionnalités d’IA générative (LLM / RAG) au cœur des produits Harvest (CRM patrimonial, outils de conseil, etc.).
Votre mission : transformer l’IA en valeur produit concrète (automatisation, recherche pertinente, meilleure UX) en garantissant qualité, sécurité et conformité en production.
Vos missions
Concevoir et délivrer des systèmes LLM “production‑grade” : pipelines RAG complets (ingestion, nettoyage, chunking, embeddings, stockage, retrieval, génération).
Mettre en place des stratégies de retrieval robustes : hybrid search (lexical + vectoriel), filtrage par métadonnées, reranking, approches multi‑stage pour optimiser recall / precision.
Réduire les hallucinations et fiabiliser les réponses (grounding, citations internes, guardrails, politiques d’abstention).
Construire un framework d’évaluation (tests, métriques de factualité et de couverture, benchmarks continus) et un monitoring LLMOps (latence, coûts, qualité, dérive, feedback utilisateur, traçage des prompts).
Industrialiser les pratiques : versioning des prompts/chaînes, A/B testing, rollouts / rollbacks, définition de SLOs.
Intégrer sécurité et compliance by design : contrôle d’accès, multi‑tenancy, gestion du PII, auditabilité, OIDC/OAuth2 (ex. Keycloak).
Travailler en étroite collaboration avec Product, Engineering, experts métier pour transformer des besoins en fonctionnalités mesurables et documenter les bonnes pratiques (RAG, prompting, LLMOps).
≥ 5 ans d’expérience en ML / ML Engineering / IA appliquée, avec des réalisations LLM / RAG en production.
Excellentes bases de software engineering : APIs, tests, performance, design modulaire, revue de code.
Maîtrise des architectures RAG production‑grade et des agents LLM (orchestration, routing, mémoire, modes dégradés).
Solide culture LLMOps : évaluation continue, monitoring, A/B testing, rollouts/rollbacks.
Stack : Python, SQL, JavaScript, FastAPI, PostgreSQL, Airflow, Qdrant (ou équivalent), Docker, Kubernetes, GitLab CI, ArgoCD, Grafana, OpenTelemetry.
À l’aise dans des environnements complexes et réglementés, autonome, structuré·e.
Bonus : expérience multi‑agents (router + tools + evaluator), finance / conformité.
Côté soft skills, nous recherchons une personne :
Curieuse, qui voit un monde d’opportunités dans l’IA.
Battante, capable de pousser les sujets dans un cadre en construction.
Avec un vrai sens de l’ownership, de la décision et de la pédagogie auprès des métiers.