Auto classification de document par marchine learning (H/F)

Auto classification de document par marchine learning (H/F)

Mission

Infotel propose un stage afin d’élaborer une méthode de classification sémantique de documents semi-structurés. Le stagiaire devra dans un premier temps faire un audit des algorithmes existants et déterminer lesquels sont adaptés au problème.

Après validation par l’équipe encadrante, il procèdera à leur implémentation en vue d’un déploiement sur un cluster de plusieurs machines. Une fois les résultats obtenus et comparés, des optimisations seront proposées afin d’améliorer les performances globales de l’exécution du code.

Environnement

Le stage sera effectué au sein des équipes travaillant sur des problématiques Big Data. Un cluster de 10 machines sera mis à disposition du stagiaire. Il sera de la responsabilité du stagiaire d’installer les outils dont il pourra avoir besoin et d’utiliser les ressources du cluster sans impacter les activités de production.

Compétences requises

Niveau Bac+5 d’école d’ingénieur ou d’université avec une spécialisation en développement informatique. Vous cultivez un fort intérêt pour l’innovation, en particulier liée au monde de la mobilité et la data science.

La connaissance de Linux, machine learning, Big Data, calcul distribué batch (Spark, Hadoop), programmation (Java, scala, python, R), Gestionnaire de sources (Git) est un plus.

Vous êtes autonome, vous savez travailler en équipe, faire des recherches personnelles, intérêt pour l’informatique en général et la data science.

Lieu & durée du stage

Stage à pouvoir dès que possible pour une durée de 3 à 6 mois, dans nos locaux de Bagnolet, Tour Gallieni II (métro Gallieni).A l’issue du stage, le stagiaire pourra se voir proposer un emploi CDI chez Infotel.

Votre candidature

Votre CV et lettre de motivation sont à adresser à recrutement-paris@infotel.com sous la référence : P17002.