Stage IA : génération de questions à partir de documents (H/F)

Toulouse Stage (6 mois)

À propos de Synapse Développement

Synapse, c’est 22 collaborateurs, un CA de 1,1 M€ /an avec une croissance à 2 chiffres chaque année.


Postuler chez nous, c’est travailler avec une équipe complémentaire orientée client qui a fait de la belle ville rose qu’est Toulouse, son siège social, mais également évoluer au sein d’une entreprise apprenante, engagée dans une dynamique de progression permanente.


Chez Synapse, notre raison d’être est d’aider l’humain à transmettre la connaissance.

Experte en Intelligence Artificielle appliquée aux textes depuis plus de 25 ans, Synapse est une entreprise 100% française.


Chaque jour, nous accompagnons nos clients au travers de nos différentes solutions :

  • Cordial : Leader Mondial des outils d’aide à l’écriture et dictionnaires pour le Français.
  • Chatbot by Synapse : Solution unique d’agents conversationnels.
  • Semantics by Synapse : Analyse sémantique pour les organisations.

Le poste

La base de connaissances de la solution DearBot est générée automatiquement à partir d’un corpus documentaire, et permet au chatbot de répondre à des questions portant sur ce corpus.

L’objectif de ce stage est de générer, à partir du corpus documentaire, des questions dont on connaît la réponse : plus on aura de questions connues, plus il sera facile de rapprocher une nouvelle requête utilisateur de l’une d’elles.

Plusieurs pistes sont envisagées à ce jour :

  • Utilisation de modèles de génération de questions pré-entraînés.
  • Reformulations de questions existantes
  • Résumé de contenu de corpus documentaire pour génération plus générale


Accompagné(e) par l’équipe de développement IA experte en NLP, votre stage vous amènera à réaliser différentes tâches :

  • Faire un état de l’art du domaine (question generation)
  • Réaliser la conception fonctionnelle et technique des modules à réaliser, accompagné(e) par l’équipe d’experts métiers et IA
  • Élaborer et entraîner des modèles en Machine Learning
  • Développer les composants techniques associés et les tests automatisés
  • Itérer pour optimiser le niveau de performance, en évaluant qualitativement et quantitativement les différentes implémentations.
  • Intégrer le module finalisé dans la solution DearBot


L’environnement technique repose sur les technologies suivantes : Python, C#, Java, Web services REST, Git, Gitlab, méthodologie Scrum LeSS

Profil recherché

Vous êtes en cours de cursus d’ingénieur en informatique.


Vous justifiez d’un bon niveau de programmation, et avez acquis les premières bases en développement de services en Machine Learning, et plus particulièrement appliqué au traitement du langage naturel. Vous souhaitez développer vos connaissances au contact d’une équipe compétente et dynamique.


Vous êtes particulièrement satisfait lorsque vous avez l’opportunité de mettre en œuvre des solutions opérationnelles et concrètes, et vous avez une appétence particulière pour l’Intelligence Artificielle et le Machine Learning.

Toulouse
Stage (6 mois)
Propulsé parTaleez