DATA SCIENTIST NLP H/F

Toulouse, FranceCDI

À propos de  DeepLinks

* Entreprise

L'industrie et la recherche sont confrontées à un défi majeur : la prolifération et la fragmentation des savoirs, qui engendrent des incompréhensions et des divisions tout au long des chaînes de valeur.

Néanmoins, les grands acteurs industriels et les organismes de recherche s'efforcent d'harmoniser leurs connaissances, comme en témoigne la course vers le jumeau numérique, une forme sophistiquée de capitalisation sur les connaissances.

Afin de réconcilier les savoirs et former un nouvel actif à part entière, DeepLinks — filiale du groupe ALCEN — propose de construire un Knowledge Graph au cœur de chaque entreprise à l'aide d'intelligences artificielles.

Le poste

* Culture d'entreprise

Au cœur de la culture d'entreprise de DeepLinks se trouve la volonté de servir le secteur de l'énergie et la science. Nous apprécions une atmosphère rigoureuse, détendue et studieuse pendant les heures de travail. Nous favorisons une séparation nette entre la sphère professionnelle et privée.

* Vue d'ensemble

Une partie de l'offre de DeepLinks repose sur des capacités automatiques d'analyse — voire d'interprétation — de documents textuels. Ce poste vise à développer ces capacités et se trouve au cœur du développement de l'offre de DeepLinks. Vous serez amené à traiter des problématiques de haut niveau dans les secteurs de l'énergie (par exemple : énergie nucléaire et CEA) et de la Big Science (par exemple : CERN).

Parmi les projets se trouve l'analyse du contenu de grands volumes de documents PDF, XML, texte. En particulier, la comparaison entre ces fichiers et des ontologies afin de les classer et les annoter.

* Description

Data Scientist chargé de la conception et du développement d'applications dédiées au traitement automatique des langues à l'aide — entre autres techniques — de modèles Deep Learning.

- Vous participez à l'exploration et à l'analyse de données pour répondre aux enjeux métiers clients.

- Vous démontrez une bonne compréhension des problématiques clients, mettez en œuvre des capacités d'analyse sur de grands volumes de données et développer des solutions pertinentes dans le respect des délais et une approche pragmatique de la qualité.

- Vous êtes capable de manipuler et d'intégrer à vos approches, des données textuelles issues de différentes sources.

- Vous documentez vos travaux et suivez l'évolution de l'état de l'art dans le domaine concerné.

- Vous abordez vos développements avec une approche orientée projet en attachant une attention particulière à la qualité de votre travail, la robustesse du code développé, l'utilisation de bonnes pratiques de développement, le respect des délais et le travail en équipe.

- Vous êtes capable de gérer un projet, d'établir les tâches pour les différents membres de l'équipe et de présenter les travaux effectués au client. Vous savez organiser et prioriser les tâches pour le bon déroulement d'un projet. Vous serez peut-être amené à bâtir votre propre équipe.

* Conditions de Travail

- Horaires :

- Lundi — jeudi : 9:00 — 18:00

- Vendredi : 09:00 — 15:30

- Adresse : La Cité, 55 avenue Louis Breguet, 31400 Toulouse

- Télétravail : nous proposons un vendredi en télétravail par semaine au maximum.

- Salaire :

- Estimation : 45 k€ — 60 k€

- Des bonus peuvent être accordés en fonction des performances de l'entreprise.

- Avantages :

- titres restaurant ;

- CESU ;

- prime vacances et prime d'intéressement ;

- prise en charge des transports en commun ;

- entre 11 et 14 RTT par an ;

- mutuelle et prévoyance groupe.

* Processus de Recrutement

Les étapes du processus de recrutement sont :

1. Analyse du CV

2. Entretien téléphonique

3. Entretien non technique en personne

4. Entretien technique en personne

5. Décision

6. Signature du contrat de travail

Tout le processus prend rarement plus de deux semaines.

Profil recherché

* Qualifications

- Docteur en sciences ou BAC+5 (ingénieur ou master)

- Spécialisation en NLP

* Compétences Requises

- Analyse des données (statistiques, probabilités, visualisation de données)

- Utilisation de librairies python dédiées au NLP (par exemple : nltk, spacy)

- Utilisation et entrainement/Fine Tunning de modèles NLP

- Programmation : Python, pandas, numpy

- Deep Learning : expérience avec Pytorch ou similaire. Entrainement/Fine Tuning de modèles Deep Learning

- Outils de travail en équipe : Git

- Expérience en gestion de projet

- Français et anglais (oral et écrit)

Détails sur le poste
Toulouse, France
CDI
IT
Propulsé parTaleez