Responsable des Incidents et de la Supervision IT
Ref : 241007D001-
Date de débutASAP
-
Localisation
92400 COURBEVOIE
-
Durée12 mois
Activités principales – Supervision :
- o Administrer et maintenir l'outil de supervision (installation, mise à jour, patching).
- o Assurer la disponibilité, la performance et la sécurité de l'outil.
- o Élaborer et mettre en œuvre des procédures de fonctionnement et de sauvegarde.
- o Configurer et gérer les actifs à superviser (serveurs, applications, réseaux, BDD … ) , On Premise et Cloud (Azure)
- o Définir, configurer et optimiser les alertes en fonction des besoins techniques.
- o Proposer et mettre en œuvre des évolutions de l'outil en fonction des nouvelles technologies et des besoins des utilisateurs.
- o Élaborer des tableaux de bord et des rapports de performance liés à la supervision.
- o Analyser les données de supervision pour identifier des axes d'amélioration.
- o Participer à des réunions régulières avec les équipes pour discuter des retours d'expérience et des besoins
- o Assurer le support technique réseau N1 :
1. Une escalade vers d’autre groupes (principalement le réseau N2) s’il n’y a pas de consigne ou si la consigne indique de réaliser cette action
2. Contacter les CIB / RIC pour les gestes de proximité et les contrôles en cas de soucis sur les équipements réseau (Sonde ipanéma, routeur, borne wifi)
3. Ouvrir les incidents auprès de OBS pour les dysfonctionnements WAN
Compétences requises :
o Maîtrise des outils de supervision (ex : Zabbix, Nagios, Prometheus, Azure Monitor, etc.).
o Connaissance des systèmes d’exploitation (Windows, Linux), réseaux, virtualisation, cloud …
o Compétences en scripting (Bash, Python, etc.) pour automatiser les tâches.
o Capacité à analyser des données techniques et à en tirer des conclusions pertinentes.
o Bonnes compétences en résolution de problèmes et en gestion des incidents.
o Excellentes capacités de communication écrite et orale.
o Capacité à travailler en équipe et à collaborer avec différents départements.
Activités principales – Gestion des incidents
• Recevoir les rapports d'incidents, les classer selon leur gravité et les enregistrer de manière structurée dans un système de gestion des incidents.
• Effectuer une évaluation rapide de la situation pour déterminer la gravité de l'incident, son impact potentiel sur les opérations et les ressources nécessaires pour résoudre le problème.
• Collaborer avec les équipes techniques et fonctionnelles pour allouer les ressources nécessaires à la résolution de l'incident. Cela peut inclure l'attribution de personnel, la mobilisation de compétences spécifiques, etc.
• Maintenir une communication claire et constante avec les parties prenantes internes et, le cas échéant, externes. Informer les parties concernées sur l'état de l'incident, les mesures prises et les délais estimés pour la résolution.
• Assurer la coordination entre les équipes impliquées dans la résolution de l'incident. Faciliter la collaboration entre les différents départements pour garantir une approche cohérente et efficace.
• Mettre en place des mécanismes de suivi pour suivre l'évolution de la résolution de l'incident. Produire des rapports réguliers pour documenter les actions prises, les leçons apprises et les améliorations possibles.
• Gérer les escalades en cas de besoin, en informant les niveaux de gestion supérieurs ou d'autres parties prenantes en fonction de la gravité et de la complexité de l'incident.