L'incident manager est un cadre supérieur spécialisé en gestion d’incidents et sécurité qui a pour principal objectif de s'assurer du bon fonctionnement des services informatiques d'un client. Il s'agit d'une catégorie de même type que le service delivery manager mais qui s'occupe particulièrement des incidents informatiques. Il occupe un poste de point de contact entre le client et les différents techniciens qui composent son équipe.
L'incident manager doit être capable d'évaluer et analyser une situation d'incident technique et mettre en place le plus rapidement possible des stratégies de réparation.
Il est en mesure de coordonner une équipe de techniciens sous sa responsabilité afin de résoudre au plus vite les incidents informatiques survenus, et minimiser leurs impacts sur le fonctionnement général du service informatique.
Il doit savoir rester calme et serein afin de pouvoir prendre des décisions éclairées même dans l'urgence et en temps de crise. Il possède en outre, un rôle central dans le processus de gestion d’incidents.
L'incident manager doit également être en mesure d'établir une bonne communication entre tous les acteurs en relation avec ces questions et savoir faire circuler l'information de manière efficace.
Dans cette perspective, il organise de manière régulière des réunions avec l'ensemble des équipes concernées afin de faire par exemple le point sur les derniers incidents rencontrés et les différents impacts notamment économiques qu'on put avoir ces derniers. Les compétences en communication et en relationnel sont donc primordiales.
En plus de ses capacités d'analyse et de gestion, l'incident manager fait preuve d'esprit d'initiative en proposant régulièrement des améliorations du système informatique et en établissant des stratégies d'anticipation des risques afin de les prévenir de manière la plus optimale possible.
Il est amené dans ce sens à produire des statistiques en rapport avec les incidents informatiques déjà rencontrés et peut proposer par la suite des analyses précises les concernant (où la problématique se situe, quelles sont les erreurs à éviter, les précautions à prendre en amont, les impacts économiques et logistiques ...)
En véritable chef de projet, une de ces missions est donc de piloter des projets visant à l'optimisation de la sécurité des services informatiques. En effet, grâce à ses connaissances techniques en informatique et ses capacités dans le domaine de la gestion, il est amène d'élaborer des plans d'amélioration de l'efficacité des systèmes informatiques.
Pour résumer, afin de pouvoir prétendre au poste d’incident manager, il est essentiel de disposer d'une bonne maîtrise technique des outils informatiques ainsi que d'excellentes compétences dans le domaine de la communication. Il doit être capable de piloter des projets dans des situations urgentes en respectant les protocoles imposés ainsi que les délais impartis. Les qualités rédactionnelles et les compétences en langue notamment en anglais ne sont pas à négliger également.
Mission(s) et réalisations
• Gestion des incidents à impact client :
• Qualification avec les équipes supports, les métiers, l’IT, les incidents déclarés.
• Suivi des incidents de production jusqu'à la reprise du service constatée par les métiers.
• Communication vers les supports IT et les correspondants métiers en français et en anglais.
Au moment de l'incident
Périodiquement s'il s'avère nécessaire (toutes les heures lorsque c’est Critique)
A la résolution de l'incident
• Alerte des experts IT développement, infrastructure et production, par tous les moyens lorsque les incidents sont bloquants pour les métiers d’Amundi Group ou ses clients externes.
• Priorisation de la reprise du service, faciliter la communication entre les équipes IT.
• Escalade vers la hiérarchie des experts Amundi-IT, et le responsable de l’équipe Résolution Management en cas de blocage sur la résolution des incidents.
• Déclenchement du processus de crise en cas d'incident Critique en production
• Garant de la bonne prise en charge et de la bonne saisi dans l’outil ITSM des incidents par les équipes supports et les experts. Relance des équipes lorsque c’est nécessaire.
• Coordination du comité incident production du matin "Morning Meeting", le matin à 08H30 pour rédiger le mail météo de 09h00.
• Assurer le point tous les jours à 18h avec les différentes équipes IT et supports métiers sur les incidents marquants de la journée pour le mail météo de 18h30.
• Réaliser le reporting sur l’activité.
• Gestion des plans de fiabilité du SI (Gestion des problèmes) :
• Analyse de la base "Incidents de production", détecter les incidents récurrents et les incidents à impact fort pour les métiers.
• Qualification des incidents à proposer à une session de résolution de problème (PSS Problem Solving Session).
• Analyse des causes et la variation des incidents avec l'outil de gestion des incidents.
• Préparation de la revue des incidents pour permettre la mise en place de plan d’actions ciblé en coordination avec le responsable du plan de fiabilisation.
• Remonter des alertes vers le responsable du plan de fiabilisation et le responsable de l’équipe résolution management.
• Faciliter le processus d’amélioration du SI dans le cadre des plans de fiabilisation du SI.
• Déclaration de toutes les actions de fiabilisation liées au incidents rencontrés le cadre de l’activité PSI.
• Gestion de la crise et Plan de secours informatique (PSI) :
• Déclenchement et animation des "Task force" lorsque les incidents n'ont pas d'origine évidente ou lorsque plusieurs entités IT sont nécessaires pour résoudre les incidents.
• Escalade vers le management Amundi ITS en cas d'incident à impact fort pour les clients.
• Participation aux tests PSI en collaboration avec le RPSI (Responsable du PSI).
• Coordonner les départs réels en PSI en collaboration avec les différentes équipes IT.
• Utilisation des outils de communication en cas de gestion de crise (PCAlive).
• Gestion des changements :
• Animation du CAB
• Remonter toute information sur les changements majeurs liés aux incidents
• Rapprocher les incidents liés aux changements
• Mise en place des processus et procédures :
• Mise à jour des procédures régulièrement en collaboration avec toute l'équipe Resolution Management après validation des équipes concernées, pour la gestion des Incidents, des plans de fiabilisation, la gestion des PSI et la gestion Crise.
Gestion des incidents :
Envoi des communications de suivi d’incidents majeurs
Animation des conférences de crise en Anglais dans un contexte international
Investigations sur un incident en cours
Garant de la bonne application des process ITIL dans les actions définies lors d’une conférence de crise
Rédaction d’ Incident Report, listant toutes les actions et décisions prises avec l’accord des entités contributrices et des entités impliquées/impactées
Qualification de tous les incidents impactant le périmètre GBIS dans un référentiel central unique
Aide à la revue hebdomadaire d'incidents (IRB)
Mission(s) et réalisations
• Gestion des changements :
Suivi des sujets autour des changes du périmètre EMEA (dont Paris) au travers de la BAL commune de l’entité
Animation des pré CAB et CAB afin de valider la bonne complétude des changements envisagés et de challengé le risque opérationnel.
Vérification de la conformité des demandes et validation
Suivi de certaines opérations majeures d’AMER si besoin pour tenir Paris au courant
Communication sur certaines opérations majeures telles que des campagnes de patch mondiales
Aide au comité hebdomadaire de revue des changements (CRB)
• Weeke...