
Alternance - Data Engineer (h/f)
Posted 13 days ago
Company Description
View moreEvery day, expect to be surprised
Browsing Veepee guarantees the daily discovery of numerous flash sales and new items. There are so many opportunities to be surprised by our beautiful brands and to find your dream item, always at a discounted price.
Veepee and its 5,000 employees are committed to helping over 7,000 brands manage their stock, promotions, and traffic. With a presence in 10 countries, they continue to take a leading role in the European e-commerce landscape.
Job Description
📄 DESCRIPTION DU POSTE
L’équipe Data Factory est responsable de la plateforme d’ingestion de données (Agate) permettant d’alimenter le Data Lake et le Data Warehouse de Veepee.
Dans un contexte de transformation stratégique (migration vers une architecture basée sur Trino / Iceberg / S3 on-prem), l’équipe renforce la fiabilité, la qualité et l’industrialisation des pipelines d’ingestion.
L’alternant(e) interviendra dans un environnement :
--> Kubernetes / VPCloud
--> Python / Java / Beam / Dataflow
--> BigQuery & nouvelle stack Trino / Iceberg
--> CI/CD (GitLab, tests automatisés)
--> Observabilité & monitoring
🎯 MISSIONS
L'alternant contribuera à la fiabilisation et à l’industrialisation de la plateforme d’ingestion de données, afin de garantir une base solide pour l’ensemble des usages Data chez Veepee.
Activité 1 : Stabilisation de la stack d’ingestion
Ajout de tests unitaires sur les pipelines existants
Amélioration de la couverture de tests
Détection des zones de fragilité
Activité 2 : Amélioration continue de la plateforme Agate
Refactoring de composants techniques
Participation à l’optimisation des performances
Contribution à la gestion des erreurs et retry
Activité 3 : Qualité & fiabilité des données
Mise en place de contrôles automatiques
Contribution aux métriques de qualité
Participation au monitoring technique
Activité 4 : Documentation & industrialisation
Rédaction de README techniques
Formalisation des bonnes pratiques
Aide à la standardisation des nouveaux pipelines
Activité 5 : Participation aux projets stratégiques
Contribution au double run (BigQuery ↔ nouvelle stack)
Support aux équipes Data Governance / Science / Analytics
👉 PRÉ REQUIS
🎓 Formation
Bac +3 à Bac +5 en informatique / data / école d’ingénieur
💻 Compétences techniques
Bases solides en Python & Java
Compréhension des APIs et pipelines de données
Notions SQL
Intérêt pour les architectures data modernes
🌍 Langues
Anglais technique
🤝 Compétences comportementales
Rigueur
Curiosité technique
Envie d’apprendre
Esprit collaboratif
👉 LE PETIT PLUS
Connaissance de Kubernetes
Notions de CI/CD
Expérience avec Airflow / Beam / Spark
Sensibilité à la qualité logicielle
