Synchrone est un cabinet de conseil en transformation des entreprises.
Nous accompagnons les DSI et les Directions Métiers de plus de 120 clients grâce à notre savoir-faire en Data & IA, DevOps & Cloud et Digital.
💡 En combinant conseil stratégique et exécution opérationnelle experte, nous concevons des solutions sur mesure, parfaitement adaptées aux spécificités métiers et IT de chaque organisation, quelle que soit sa taille ou son modèle.
Nos practices spécialisées – acculturation à l’IA, agentisation, data gouvernance, move to cloud, SRE, expérience client, etc. – proposent des trajectoires de transformation personnalisées, ancrées dans les enjeux concrets des DSI et des Directions Métiers.

Rejoignez Synchrone pour un projet stratégique auprès d’un client grand compte. En tant que Data Engineer spécialisé Databricks, vous serez le pilote technique des pipelines Big Data sur Databricks, garantissant l’industrialisation, la scalabilité et la qualité des flux de données pour des projets analytiques et IA à grande échelle.

Missions :

1️⃣ Concevoir, développer et maintenir des pipelines de données robustes et scalables sur Databricks.

2️⃣ Exploiter pleinement les fonctionnalités de Databricks : Delta Lake, Spark SQL, notebooks collaboratifs, MLflow pour gérer les workflows et modèles prédictifs.

3️⃣ Transformer et intégrer des données issues de sources multiples (bases relationnelles, API, fichiers, streaming) dans Databricks.

4️⃣ Collaborer avec les Data Scientists pour industrialiser les modèles de Machine Learning et Analytics dans Databricks.

5️⃣ Garantir la qualité, la sécurité et la fiabilité des données sur les environnements Databricks Cloud.

6️⃣ Participer aux choix d’architecture Cloud et Big Data pour optimiser les performances et la scalabilité.

7️⃣ Automatiser les processus de déploiement et de supervision via DataOps et CI/CD intégrés à Databricks.

Environnement technique :

Big Data / Cloud : Databricks, Spark, Delta Lake, Hadoop, Snowflake, Redshift, BigQuery
Langages : Python, SQL, Scala
ETL & Orchestration : Airflow, DBT, Dataiku, Talend
Machine Learning / IA : Modèles prédictifs, NLP, clustering, MLflow
DevOps / DataOps : CI/CD, Docker, Kubernetes, Terraform
Cloud : AWS, Azure, GCP

Exemples de nos projets innovants :

⚡ Énergie : Prévisions de consommation et optimisation de l’équilibre offre/demande avec pipelines Databricks et MLflow.

🚆 Transports : Maintenance prédictive des infrastructures via traitement temps réel des données IoT sur Databricks.

🔍 Profil recherché :

Minimum 4 ans d’expérience en Data Engineering sur Databricks ou environnements Big Data Cloud.
Expertise avancée sur Databricks (Delta Lake, notebooks, Spark SQL, MLflow).
Solide expérience en Python, SQL et Spark, avec capacité à industrialiser des pipelines et modèles ML.
Autonomie, rigueur, esprit analytique et capacité à collaborer avec des équipes pluridisciplinaires.

Data Engineer Databricks (h/f)

Company Description

Job Description

Benefits