Stagiaire Ingénieur(e) - Détection de Données Hors Distribution (OOD) pour les Modèles de Langage de Grande Taille (LLM)

Toulouse, France Stage (6 mois)

À propos de IRT Antoine de Saint Exupéry

A l’IRT Saint Exupéry nous réalisons des projets de Recherche en Technologie collaboratifs, principalement pour les secteurs aéronautique et spatial.

Créé et cofinancé par l’Etat et nos partenaires industriels, notre mission est d’accélérer la recherche technologique française au profit de l’écosystème national, en créant un pont entre le monde académique et l’industrie. 

Ici, tu travailleras dans un environnement collaboratif avec des équipes issues du monde académique, industriel, du personnel détaché par de grands groupes, des chercheurs ou encore des doctorants.

Notre force c’est le niveau d’expertise de nos collaborateurs et nos plateformes technologiques différenciantes : https://storage.net-fs.com/hosting/6834310/4/

Pourquoi nous rejoindre ?

-      Prendre part à des projets de recherche innovants

-      Vivre ta passion pour la technologie 

-      Te Développer dans un environnement collaboratif intégré et multiculturel

Quelques-uns de nos avantages :

Un environnement éthique engagée: Gender Equality Plan , la prise en compte des enjeux environnementaux, sociaux, économiques et éthiques dans leurs activités via un Gender Equality Plan et une politique R.S.E. ambitieuse.

Un CSE dynamique : clubs, activités, offre culturelle

La prise en charge des déplacements éco-responsables (75% de ton abonnement transports en commun) ainsi qu'une prime mobilité douce.

Saches que l’IRT Saint Exupéry s’engage pour la diversité et l’inclusion. Toutes les candidatures à ce poste seront étudiées sans différence de traitement liée au sexe, à l’âge, à la nationalité ou tout autre critère discriminant. Tous nos postes sont ouverts aux personnes en situation de handicap.

Le poste

Au sein de l'équipe Technologies Intelligentes, tu auras pour mission d'adapter et d'étendre des méthodes de détection de données hors distribution (Out-Of-Distribution, OOD) pour les modèles de langage de grande taille (Large Language Models, LLM). Le projet comprendra :

·         Réaliser un état de l'art sur les méthodes de détection OOD post-hoc pour les LLM.

·         Adapter et étendre les méthodes de détection OOD développées pour la vision par ordinateur aux LLM, en utilisant notamment la librairie OODeel, développée en interne. Tu pourras également contribuer au développement de cette librairie.

·         Explorer et proposer de nouvelles techniques basées par exemple sur la décomposition des caractéristiques (features) ou l'analyse par concepts.

·         Valider expérimentalement les méthodes proposées sur des jeux de données pertinents.

·         Documenter les travaux réalisés et contribuer à la rédaction d'un article scientifique.

Profil recherché

Tu recherches un stage de fin d’études de niveau Bac+5 (Ingénieur, Master) en cursus Machine Learning, Mathématiques Appliquées, Informatique ou une discipline associée. Nous cherchons un.e candidat.e avec les compétences suivantes:
• Connaissances théoriques solides en Machine Learning et Deep Learning, en particulier sur les réseaux
des neurones, la descente du gradient et l’optimisation mathématique.
• Expérience avec les librairies de Deep Learning modernes, en particulier PyTorch et/ou TensorFlow.
• Familiarité avec l’écriture scientifique sur LaTex.
• Être capable de lire, écrire et s’exprimer en anglais.

Rejoins nous !

"Ne prévois pas ton futur, rends-le possible"

Détails sur le poste
Toulouse, France
Stage (6 mois)
Ingénierie
Propulsé parTaleez