Machine Learning Engineer for Satellite Ground Segment

Toulouse  - Stage (6 Mois)

À propos de AIRBUS Defence & Space


                    Airbus Defence & Space Toulouse    

Airbus est un leader mondial de l’aéronautique, de l’espace, de la défense et des services associés. En 2016, l’entreprise a dégagé un chiffre d’affaires de 67,0 milliards d’euros avec un effectif d’environ 134 000 personnes. Airbus propose la gamme d’avions de transport de passagers la plus complète, de 100 à plus de 600 sièges. Airbus est également le fournisseur d’avion de ravitaillement, de combat, de transport et de mission leader en Europe, ainsi que le numéro un européen et le numéro deux mondial de l’industrie spatiale. Sur le marché des hélicoptères, Airbus fournit les voilures tournantes civiles et militaires les plus performantes au monde.

Nos équipes travaillent avec passion et détermination pour faire du monde un endroit plus connecté, plus sûr et plus intelligent. Fiers de notre travail, nous nous appuyons sur l’expertise et l’expérience de chacun pour atteindre l’excellence. Notre diversité et culture du travail en équipe nous poussent à accomplir l’extraordinaire - sur terre, dans le ciel et dans l’espace.

Description du poste

itre du stage :

Modélisation de la consommation des ressources de calcul dans un segment sol satellite en architecture virtualisée.

Descriptif du stage :

Le service ingénierie des infrastructures des segments sols conçoit et implémente les systèmes informatiques de gestion d'un satellite. A ce titre, il assure la conception et la validation de systèmes distribués de traitement massif de données, notamment d'imagerie satellite mais également assurant le contrôle et la gestion de mission du satellite. L'accélération du nombre et de la complexité des constellations satellite tend à rendre le segment sol de plus en plus complexe tout en augmentant le scope de ses missions. De plus les récents progrès dans le domaine des architectures de systèmes informatiques - poussés par les grands acteurs du Web - tendent à revoir la manière dont sont développés et optimisés ces systèmes.

L'un des enjeux majeurs actuel de la conception des segments est de permettre une analyse de plus en plus précise du fonctionnement des applications et de leur possible re-configuration dynamique. L'objectif étant de pouvoir optimiser les ressources matérielles (ou virtuelles) mises à disposition et d'anticiper des pics de charges ou des changements des modes de consommations. Pour cela, l'équipe R&T travaille activement sur la modélisation de l'utilisation des ressources d'un segment sol en exploitant directement les données brutes de consommations des ressources physiques (typiquement le taux d'occupation des CPU). Ces modèles doivent servir à faire de la prédiction de capacité mais aussi à détecter des comportements systèmes anormaux permettant d'anticiper de possibles dysfonctionnements ou surcharges. En ce sens, la problématique se rapproche des études faites par les grands acteurs du cloud public qui doivent optimiser l'exploitation de leur data center tout en assurant des taux de fiabilité de plus en plus élevés sur des systèmes distribués de plus en plus complexes.

Le stage proposé est intégré dans cet axe d'étude et aura pour objectif d'explorer des approches nouvelles issues des dernières publications à travers :
- Une étude de la littérature scientifique et industrielle (groupes de recherche et grands acteurs du domaine cloud public).
- Un benchmark technique de plusieurs approches sélectionnées (notamment celles à base de réseaux de  neurones profonds et potentiellement d'apprentissage par renforcement) sur un système réel.
- L'implémentation d'un prototype opérationnel qui sera évalué sur les données un système en opération (segment sol opéré par AIRBUS DS à Toulouse).

Le stage s'effectuera dans le cadre du DataLab à Airbus Defence and Space - Space Systems Toulouse, qui hébergera les moyens matériels nécessaires au stage. Le stage aura la possibilité d'assister à des conférences organisées par la communauté universitaire de Toulouse (IMT, LAAS, ONERA, IRIT...). ?

Description du profil

Connaissances requises
· Informatique : Spark, virtual machine, cloud, machine learning (clustering, classification, apprentissage par renforcement), SVM, deep learning, analyse statistiques de series temporelles discrétisées
· Développement informatique : python, shell, java
· ?Environnements : Linux (CentOS, Suse, debian)


Propulsé par