📄 DESCRIPTION DU POSTE

L’équipe Data Factory est responsable de la plateforme d’ingestion de données (Agate) permettant d’alimenter le Data Lake et le Data Warehouse de Veepee.
Dans un contexte de transformation stratégique (migration vers une architecture basée sur Trino / Iceberg / S3 on-prem), l’équipe renforce la fiabilité, la qualité et l’industrialisation des pipelines d’ingestion.
L’alternant(e) interviendra dans un environnement :

--> Kubernetes / VPCloud

--> Python / Java / Beam / Dataflow

--> BigQuery & nouvelle stack Trino / Iceberg

--> CI/CD (GitLab, tests automatisés)

--> Observabilité & monitoring

🎯 MISSIONS

L'alternant contribuera à la fiabilisation et à l’industrialisation de la plateforme d’ingestion de données, afin de garantir une base solide pour l’ensemble des usages Data chez Veepee.

Ajout de tests unitaires sur les pipelines existants

Amélioration de la couverture de tests

Détection des zones de fragilité

Refactoring de composants techniques

Participation à l’optimisation des performances

Contribution à la gestion des erreurs et retry

Mise en place de contrôles automatiques

Contribution aux métriques de qualité

Participation au monitoring technique

Rédaction de README techniques

Formalisation des bonnes pratiques

Aide à la standardisation des nouveaux pipelines

Contribution au double run (BigQuery ↔ nouvelle stack)

Support aux équipes Data Governance / Science / Analytics

👉 PRÉ REQUIS

Bac +3 à Bac +5 en informatique / data / école d’ingénieur

Bases solides en Python & Java

Compréhension des APIs et pipelines de données

Notions SQL

Intérêt pour les architectures data modernes

Anglais technique

Rigueur

Curiosité technique

Envie d’apprendre

Esprit collaboratif

👉 LE PETIT PLUS

Alternance - Data Engineer (h/f)

Company Description