
Apprentissage – Data Scientist – Extraction De Connaissances Multi-sources & Rag (h/f)
Posted 22 days ago
Company Description
View moreHome of innovative talents across the world. Builders of a sustainable future, we are pioneering mobility since 1898.
Job Description
Vos Missions
Identifier et cartographier les différents canaux/sources de connaissances potentiellement utiles (incidentologie, logs, codes erreurs, bases documentaires, guides utilisateurs, notes techniques, mises à jour systèmes, etc.) afin de couvrir les besoins des partenaires internes et des clients finaux.
Mettre en place des méthodes et techniques d’extraction et de préparation des connaissances à partir de sources textuelles et multimodales (documents, pièces jointes, images/captures, vidéos), incluant nettoyage, déduplication, normalisation, et enrichissement par métadonnées.
Construire une base de connaissances exploitable (structurée et/ou indexée) et un module de recherche performant (recherche par mots-clés + recherche sémantique), avec gestion de la ‘fraîcheur’, du versioning, et des contrôles qualité. Intégrer ces briques dans une approche RAG : stratégie de retrieval, sélection/reranking des passages, génération de réponses avec traçabilité (citations des sources) et gestion des cas « information insuffisante », puis itérations d’amélioration via métriques et retours utilisateurs.
Qui êtes-vous ?
Étudiant(e) Bac+4/5 en informatique, data/IA, génie logiciel ou domaine connexe
Intérêt marqué pour l’extraction d’information, la recherche d’information, le NLP/LLM et/ou les systèmes RAG
Bonnes compétences en communication, organisation et travail transverse (qualité, ingénierie, après-vente, usines…)
Capacité à travailler en autonomie, à prendre des initiatives et à produire des livrables concrets et robustes
Vous êtes curieux(se), inventif(ve), et avez un bon relationnel pour travailler avec des partenaires variés (ingénierie, après-vente ou autres partenaires internes).
Autonome et rigoureux(se), une expérience en gestion de projets multiples est souhaitable.
Une appétence pour le monde automobile et les services connectés est un plus
