Magellium (Groupe Artal), avec ses 300 collaborateurs, est un acteur indépendant, spécialisé sur la chaîne de valorisation de la donnée de télédétection (du capteur satellite ou drone jusqu’à son utilisation dans les systèmes et les services d’observation de la terre, la cartographie et la Géo intelligence) qui promeut la maîtrise des technologies spatiales, du logiciel, du traitement de signal et de la géomatique.
Contexte
Depuis 2020, Magellium opère la production de produits de couverture d’ eau, de neige et glace sur le territoire européen. Ces produits issus d’observations satellite indiquent la présence de neige sur la surface continentale et la présence de glace sur les lacs et rivières et sont délivrés par le service Copernicus terrestre. Ils sont générés dès la mise à disposition des observations Sentinel-1 et Sentinel-2 par les services de l’agence spatiale européenne (ESA).
Magellium coordonne l’ensemble du projet autour duquel a été fondé un consortium. Magellium est, au sein du consortium, l'interlocuteur privilégié avec le client. Ce consortium est composé de laboratoires et d’entreprises privées européens responsables de la conception, de la maintenance, et du maintien à niveau d’ algorithmes scientifiques de détection de neige et de glace.
De son côté, l‘équipe de Magellium apporte du support au client, pour la promotion des produits auprès des utilisateurs d’une part, et est également et avant tout responsable de la production opérationnelle en quasi temps-réel (quelques heures) des données sur la neige et la glace. Cette équipe est également responsable du développement et du maintien des briques scientifiques traitant les données glace. Les produits satellite Sentinel-1 et Sentinel-2, servant de base à la création des produits neige et glace, sont traités dès leur réception sur un cloud européen, appelé DIAS. Le DIAS permet d’accéder directement à l’ensemble des données Sentinel et de disposer d’une large infrastructure de calcul, ainsi que de capacités de diffusion des données.
Description du poste
Vous intégrerez une équipe constituée d’un chef de projet, d’un coordinateur technique ainsi que de 2 ingénieurs thématiciens, où vous serez responsable des opérations comprenant une participation active à la maintenance des chaînes de production. Vos tâches seront les suivantes:
Assurer le suivi de la production des produits au quotidien en support au responsables des opérations
Maintenir le système de production en conditions opérationnelles sur le DIAS, cela inclut aussi la diffusion des données.
Evolution du système de production en lien avec le coordinateur technique, pour y intégrer de nouveaux algorithmes scientifiques ou y implémenter de nouvelles fonctionnalités tant pour les partenaires, le client, les utilisateurs que cette même équipe.
Le suivi et la maintenance de la production seront votre principale mission. Le suivi des opérations consistent à :
Détecter toute anomalie ou retard dans la production de la journée en s’appuyant sur le tableau de bord du système ou sur les tickets ouverts par les partenaires scientifiques (outil MANTIS), ceux-là étant chargés de faire remonter toute anomalie dans la génération de leurs produits.
Identifier les erreurs, identifier leur(s) cause(s) sur la base de la documentation existante. Si l’anomalie est nouvelle, la documenter dans le Git du projet et dans le manuel des opérations, la comprendre, y remédier et si nécessaire mettre en place un patch en anticipation d’une éventuelle prochaine occurrence.
Vérifier le bon fonctionnement des interfaces d’accès aux produits.
En cas de défaillance du système, il sera potentiellement nécessaire de consulter la base de données renseignant tout ce qui s’y déroule et s’y est déroulé afin d’identifier l’origine de la défaillance. Il conviendra de savoir relancer le processus en défaut ou bien le système dans sa totalité si nécessaire. Les perturbations pouvant également incomber au DIAS, il sera alors nécessaire d’être en interface avec leur équipe support afin de les informer des problèmes rencontrés et de rechercher une solution avec eux. Selon la gravité de la situation, une communication avec le client pourra être envisagée afin d’avertir partenaires et utilisateurs de la situation opérationnelle du système.
Certaines anomalies étant bloquantes ou bien récurrentes, elles devront être corrigées. Il conviendra alors de développer un patch en collaboration avec le coordinateur techniqu afin de résoudre le problème - que ce soit en agissant à la source du problème ou en automatisant la gestion de l’erreur, de tester la nouvelle version du système sur un environnement de test, et de la déployer sur l’environnement de production après vérifications de son opérabilité.
Aussi, lors de la mise à jour des algorithmes, il sera nécessaire de déployer la/les nouvelle(s) image(s) Docker correspondante(s) et d’effectuer des simulations sur l’environnement de test antérieurement au déploiement sur l’environnement de production.
Ces manipulations nécessitent des vérifications régulières, et donc de la rigueur et de l’organisation. Il faudra savoir prioriser la correction des erreurs/anomalies en fonction de leur gravité, de leur fréquence d'occurrence, ainsi que de la perte de ressource qu’elles entraînent et effectuer ces corrections.
Ponctuellement il sera nécessaire de lancer le calcul de certains produits sur des machines virtuelles (produits non temps-réel, annuels ou mensuels par exemple, ou dans le cadre d’un campagne de retraitement ou du traitement d’une archive de produits satellites). Il s’agira ensuite de les publier sur les interfaces utilisateurs dédiées avec l’aide du support du DIAS. La publication des produits sur le catalogue sera vérifiée en consultant l’API.
De façon générale, on vous demandera de vous appuyez sur la documentation et les outils en place afin d’être rapidement autonome.
Technologies utilisées : OpenStack, Terraform, Docker, Nomad, Python, PostgreSQL, Java, View, Git