SRE (Service Reliability Engineer) TECHNIQUE
Ref : 250228B001-
Date de débutASAP
-
Localisation
75 - Paris
-
DuréeA définir
-
Profil
Ingénieur de production
-
Secteur d'activité
Banque et Finance

Nous recherchons un SRE pour mission de 3 mois renouvelables sur Paris
- Partage avec les équipes de développement des objectifs communs de disponibilité et de performance de la production
- Maitrise des risques et anticiper les impacts sur le SLO des services en production liés aux opérations sur votre périmètre
- Intégration et participation dès le début des phases de cadrage des projets et des évolutions à venir
- Avoir une vision de bout en bout sur l’ensemble des opérations impactant le périmètre (incidents, mises en productions, changements, obsolescence…)
- Développement de la résilience, en automatisant et en outillant efficacement les opérations afin de réduire le risque d’erreur, augmenter les contrôles à la source et minimiser l’impact des pannes sur l’expérience utilisateur
- Utilisation de la donnée et les indicateurs de performance au quotidien pour opérer (en automatique ou en manuel à défaut). Être plus réactif en cas d’incident, et prioriser les évolutions de la plateforme afin d’accroitre sa résilience.
Par vos connaissances et maîtrises techniques mais aussi fonctionnelles de votre périmètre, le Service Reliability Engineer est identifié comme référent opérationnel. Il doit développer constamment cette connaissance et la partager avec son équipe ou les membres de la guilde SRE dans le cas d’une offre de service IT.
Le collaborateur devra réaliser tout ou partie des activités suivantes :
Maintien des objectifs de niveau de service
• Responsabilité de la disponibilité, de l’intégrité, de la résilience et de la qualité de la plateforme de production
• Reposition du service en cas d’incidents, en mobilisant les ressources adéquates si nécessaire.
Une culture DevOps au service de l’innovation
• Travail en étroite collaboration avec les équipes de développement et d’exploitation, afin d’être informé des changements prévus et d’anticiper leurs impacts sur la production.
• Information des équipes de développement sur les sujets des environnements hors-prod afin de prendre en compte les contraintes opérationnels au plus tôt.
Monitoring et Alerting
• Mis en place le bon niveau de monitoring et d’alertes.
• Construction des tableaux de bord afin de suivre visuellement les indicateurs de santés de services les plus pertinents et représentatif de l’expérience utilisateur, afin d’éclairer la prise de décision notamment lors des changes ;
Amélioration continue et mise à l’échelle
• Identification et priorisation des pistes d’industrialisation et d’automatisation, en coordination avec les équipes produites dans le but d’optimiser la résilience, les performances et le coût de productions (cout d’infrastructure et de travail)
• Développement des scripts d’automatisation et outiller les opérations, en suivant les exigences ainsi que les bonnes pratiques de développement agile et en se souciant de la maintenabilité des développements.
Sécurité et Gestion de l’obsolescence
• Pilotage de l’obsolescence et les non conformités et veiller à la priorisation de leur prise en charge avec le budget adéquat en intégrant les éléments des équipes produits et ceux des IT Métiers.
Le niveau sur LINUX : Expert
ANGLAIS OBLIGATOIRE