SYNCHRONE

Data Engineer Databricks (h/f)

Posted 16 days ago

Experience
3-5 years
Offer salary
Not specified
Location
Ile De France, France
Contract type
CDI
Work arrangement
Hybride
Starting Date
ASAP
Stack required
Databricks
Spark
Talend
Dataiku
Dbt
Delta Lake
Hadoop
Snowflake
Redshift
Bigquery

Company Description

View more

Synchrone est un cabinet de conseil en transformation des entreprises.
Nous accompagnons les DSI et les Directions Métiers de plus de 120 clients grâce à notre savoir-faire en Data & IA, DevOps & Cloud et Digital.
💡 En combinant conseil stratégique et exécution opérationnelle experte, nous concevons des solutions sur mesure, parfaitement adaptées aux spécificités métiers et IT de chaque organisation, quelle que soit sa taille ou son modèle.
Nos practices spécialisées – acculturation à l’IA, agentisation, data gouvernance, move to cloud, SRE, expérience client, etc. – proposent des trajectoires de transformation personnalisées, ancrées dans les enjeux concrets des DSI et des Directions Métiers.

Job Description

Rejoignez Synchrone pour un projet stratégique auprès d’un client grand compte. En tant que Data Engineer spécialisé Databricks, vous serez le pilote technique des pipelines Big Data sur Databricks, garantissant l’industrialisation, la scalabilité et la qualité des flux de données pour des projets analytiques et IA à grande échelle.


Missions :


1️⃣ Concevoir, développer et maintenir des pipelines de données robustes et scalables sur Databricks.

2️⃣ Exploiter pleinement les fonctionnalités de Databricks : Delta Lake, Spark SQL, notebooks collaboratifs, MLflow pour gérer les workflows et modèles prédictifs.

3️⃣ Transformer et intégrer des données issues de sources multiples (bases relationnelles, API, fichiers, streaming) dans Databricks.

4️⃣ Collaborer avec les Data Scientists pour industrialiser les modèles de Machine Learning et Analytics dans Databricks.

5️⃣ Garantir la qualité, la sécurité et la fiabilité des données sur les environnements Databricks Cloud.

6️⃣ Participer aux choix d’architecture Cloud et Big Data pour optimiser les performances et la scalabilité.

7️⃣ Automatiser les processus de déploiement et de supervision via DataOps et CI/CD intégrés à Databricks.


Environnement technique :


  • Big Data / Cloud : Databricks, Spark, Delta Lake, Hadoop, Snowflake, Redshift, BigQuery

  • Langages : Python, SQL, Scala

  • ETL & Orchestration : Airflow, DBT, Dataiku, Talend

  • Machine Learning / IA : Modèles prédictifs, NLP, clustering, MLflow

  • DevOps / DataOps : CI/CD, Docker, Kubernetes, Terraform

  • Cloud : AWS, Azure, GCP


Exemples de nos projets innovants :


Énergie : Prévisions de consommation et optimisation de l’équilibre offre/demande avec pipelines Databricks et MLflow.

🚆 Transports : Maintenance prédictive des infrastructures via traitement temps réel des données IoT sur Databricks.


🔍 Profil recherché :


  • Minimum 4 ans d’expérience en Data Engineering sur Databricks ou environnements Big Data Cloud.

  • Expertise avancée sur Databricks (Delta Lake, notebooks, Spark SQL, MLflow).

  • Solide expérience en Python, SQL et Spark, avec capacité à industrialiser des pipelines et modèles ML.

  • Autonomie, rigueur, esprit analytique et capacité à collaborer avec des équipes pluridisciplinaires.

Benefits

  • Développement compétences
  • Sport & bien-être
  • Engagement RSE
  • Avantages RH
  • Primes attractives
  • Épargne salariale
  • Udemy Business
http://www.synchrone.fr