
Ingénieur De Production / Sre (h/f)
Posted 20 days ago
Company Description
View moreSofteam, filiale conseil et services de Docaposte.
Nous accompagnons les acteurs publics et privés dans la mise en œuvre de leurs projets de transformation numérique. En mobilisant des expertises sectorielles et technologiques, nous proposons une offre de conseil et de services créatrice de valeur, pour construire ensemble un numérique responsable, durable et au service de l’intérêt général.
Softeam, c'est aussi :
🏆 Un partenaire de confiance et de proximité reconnu dans les secteurs Banque/Finance/Assurance, Industrie/Services/Utilities et Secteur public,
🧑 2000 experts très expert prêts à vous accompagner,
Job Description
Ce que nous recherchons :
SOFTEAM Digital recherche un(e) Ingénieur(e) de production pour intégrer notre équipe à Sophia-Antipolis
Rattaché(e) à la direction des Systèmes d'Informations, vous seriez le garant de la fiabilité, de la performance et de la pérennité des applications en production, en adoptant une approche systématique et automatisée afin de garantir des engagements de service de la DSI envers ces clients internes (Business Units – BUs). Vous travaillerez en étroite collaboration avec les équipes d’ingénierie BU d’une part et des équipes d’infrastructure, de Centre de Services et le Service Delivery Manager. Vous contribuerez à l’adoption du modèle SRE et à la transformation du modèle d’exploitation vers ce modèle (pour accompagner la transformation vers le cloud).
Vos missions :
Gestion des Systèmes et des Applications
Garantir les engagements de services
Assurer une surveillance et une observabilité des systèmes et des applications, identifier et résoudre les problèmes avant qu'ils n'affectent les utilisateurs (capacity planning, mise en œuvre des mécanismes de résiliences et haute disponibilité, ...)
Planifier, surveiller les différents traitements
Mettre en production les nouvelles applications ou évolutions (y compris en mode CI/CD et GitOps)
Gestion des différents environnements (Recette, Pré Production, Production)
Gestion des Incidents et des Erreurs
Répondre rapidement aux incidents, analyser les causes et mettre en œuvre des solutions pour prévenir la récurrence des problèmes
Effectuer les contrôles au quotidien des traitements, corriger les erreurs, faire les reprises nécessaires et en informer les responsables
Automatisation et Optimisation des Performances
Développer et maintenir des scripts et des outils d'automatisation pour améliorer les opérations et réduire les interventions manuelles
Travailler continuellement à l'amélioration des performances des systèmes et des applications, en évaluant et en optimisant les configurations
Automatiser des déploiement (y compris infrastructure as A Code, Pipelines CI/CD, Chart de déploiement Kubernetes, ou scripts de déploiement)
Gérer de configuration des assets
Gestion de l'Infrastructure et de la Sécurité
Superviser et gérer l'infrastructure Cloud provisionnée, assurer une utilisation efficace des ressources et une conformité aux standards de l’entreprise
Participer à la définition de la politique de sauvegarde afin de s’assurer des engagements des services
Utiliser et respecter les processus DSI basés sur des bonnes pratiques ITIL tout en adoptant une posture DevOps
Profil recherché :
Issu(e) d’une formation en informatique (Bac+2 minimum)
Minimum 3 ans d’expérience en ingénierie de production
Vous avez une connaissance globale back office/front office et de solides bases dans la compréhension de l'exploitation
Bonnes connaissances des systèmes d'exploitation (Linux/Windows), de la configuration réseau, des plateformes J2EE (JBoss, Tomcat) et de l'architecture des systèmes en environnement Cloud virtualisé
Bonne capacité à écrire des scripts pour l'automatisation des tâches et la résolution de problèmes : Ansible, terraforme, Helm, Ansible, Shell
Expérience avec des plateformes cloud (VMware NSX/Openstack/Outscale)
Expérience avec les outils de surveillance et d'observabilité (Prometheus, Grafana, Zabbix): mise en œuvre de tableaux de bord, de configuration des seuils d’alertes
Expérience avec les systèmes de logging (loki, ELK) : formatage des logs, configuration d’envoi, requêtage et mise en place d’indicateurs.
Compétence dans l'utilisation des outils Terraform, Ansible et Kubernetes pour la gestion automatisée de l'infrastructure
Compétences non techniques :
Résolution de problèmes et analyse
Travail d'Équipe et communication
Orientation vers l'amélioration continue et innovation
Gestion de projet et organisation
