Le data steward s’occupe de la gouvernance et de la gestion des données au sein d’une entreprise, mais aussi de leur intendance ou stewardship. Il est garant de l’organisation et de la qualité de la data, qui sera par la suite interprétée par les data analysts et les data scientists.
Le data steward en bref
- Secteur d’activité : informatique, data ;
- Missions : intendance et gouvernance des données ;
- Compétences requises : connaissances techniques, analyse, rigueur, esprit d’équipe, organisation ;
- Statut : indépendant ou salarié ;
- Niveau minimum d’accès : bac + 2 à bac + 5 ;
- Outils : bases de données, normes et législation, langages de programmation.
À Retenir sur le métier de data steward
- Garant du cycle de vie des données, le data steward analyse l’apport qualitatif des données stockées ;
- Il s’assure de la bonne organisation des bases de données ;
- Chargé de la gouvernance et de l’intendance, ou stewardship, de la donnée, il définit les normes et procédures de l’entreprise concernant la data ;
- Il s’insère dans une équipe comprenant plusieurs corps de métiers : data engineers, data analysts et data scientists.
Définition du data steward
Intendant de la donnée, le data steward est le garant de la gestion, de la qualité et de l’organisation des données au sein d’une entreprise. À partir des politiques définies en matière de data, il trie, qualifie et vérifie les données. Son rôle est de s’assurer de la pertinence et de la structuration des espaces de stockage. Enfin, c’est l’interlocuteur stratégique de la donnée : il répond à toutes les questions concernant la data.
Quelles sont les fonctions d'un data steward ?
- Trier et qualifier la donnée en assurant le nommage de la data, en vérifiant la fraîcheur des données et en supprimant les éventuels doublons ou données obsolètes ;
- Organiser les données, au départ en grandes bases de données peu organisées dites data lakes, puis en bases de données triées et standardisées, les data warehouses ;
- Documenter les connaissances autour des datasets, c’est-à-dire des jeux de données ;
- Définir les politiques et les procédures en matière de données dans l’entreprise ;
- S’assurer de la sécurité des données en appliquant les principes de la cybersécurité ;
- Faire respecter les normes en matière de collecte et de stockage des données personnelles ;
- S’assurer de la bonne conduite du cycle de vie de la donnée : création, stockage, modification, archivage ;
- Communiquer avec les services de l’entreprise qui utilisent la donnée : non seulement l’équipe data, mais aussi les services marketing ou financier.
Quels sont les outils utilisés par un data steward ?
Le data steward manipule au quotidien des bases de données et des services de cloud computing (AWS, Google Cloud, Microsoft Azure). Il doit donc parfaitement maîtriser SQL, le langage des bases de données.
Il fait également appel à des langages de programmation, et particulièrement Python. Il peut ainsi développer des scripts ou des programmes de gestion de bases de données. Des outils de reporting tels que Tableau ou des outils de gestion de données comme Talend peuvent aussi entrer en jeu.
Pour travailler efficacement avec l’équipe data et l’ensemble des services de l’entreprise, il utilise enfin des outils collaboratifs tels que Trello, Slack ou Zoom.
Quelles compétences demande le métier de data steward ?
En tant qu’interlocuteur clé dans l’entreprise pour les questions relatives à la donnée, le data steward doit faire preuve de compétences techniques solides, mais aussi de qualités humaines :
- Connaissances techniques en informatique et data : langages de programmation (notamment Python), SQL, bases de données, cloud computing, cybersécurité ;
- Maîtrise du cadre législatif et réglementaire concernant la collecte, le stockage et l’utilisation des données personnelles ;
- Capacités d’analyse pour qualifier précisément la donnée et constituer des data sets pertinents pour les besoins business et utilisateurs ;
- Rigueur et organisation pour trier, qualifier et mettre à disposition la donnée ;
- Polyvalence pour répondre aux besoins variés de l’entreprise concernant la data et pour faire évoluer ses tâches en fonction du contexte ;
- Force de proposition pour fixer des procédures et politiques en matière de données et pour veiller à les faire respecter ;
- Travail en équipe et relationnel pour participer aux projets data à l’aide des autres corps de métier de l’équipe dédiée ;
- Pédagogie et disponibilité pour assurer son rôle de référent pour les questions liées à la Big Data dans l’ensemble de l’entreprise.
Quelle est la formation à suivre pour devenir data steward ?
Pour devenir data steward, une formation de niveau bac + 2 minimum est demandée, avec une spécialité en administration des bases de données.
Toutefois, les cursus de niveau bac + 5 sont valorisés par les recruteurs. Il est ainsi possible de suivre une formation en école d’ingénieurs, en école d’informatique ou un parcours universitaire en informatique de niveau Master, puis d’acquérir des expériences en gestion des bases de données, extraction de données et statistiques.
Quelle est la rémunération d'un data steward ?
Le salaire médian d’un data steward en France est d’environ 45 000 € bruts annuels. En sortie d’école, un débutant peut obtenir un salaire de 40 000 € bruts annuels. Pour un profil expérimenté, le salaire brut annuel peut atteindre les 65 000 €.
Dans quels types d'entreprises et dans quels secteurs d'activité travaille un data steward ?
Deux types de postes sont disponibles pour les data steward :
- Les postes en interne dans une entreprise de grande taille, qui possède son propre service data ;
- Les postes en externe, en tant qu’indépendant ou en travaillant pour une ESN ou SSII comme prestataire de services.
Les secteurs d’activité qui emploient des data stewards sont variés. On peut citer le domaine public, la santé et la recherche, la finance, les télécommunications, les banques et assurances, le marketing et la publicité, l’industrie, et enfin les entreprises spécialisées dans l’intelligence artificielle et le deep learning.
À quels métiers peut être comparé le data steward ?
Le métier de data steward peut être comparé avec les autres métiers du Big Data, tels que :
- Le data engineer, qui est chargé de la construction de l’infrastructure data de l’entreprise ;
- Le data analyst, qui interprète les données pour améliorer les performances business de l’entreprise ;
- Le data scientist, qui fait appel au machine learning pour anticiper le comportement des consommateurs et en tirer de nouvelles opportunités de revenus.
Le data steward peut également évoluer vers les métiers de data manager ou CDO (Chief Data Officer).
FAQ
Quelle est la différence entre un data steward et un data engineer ?
Le data engineer construit l’infrastructure des données. Le data steward, quant à lui, est chargé de la gestion et de la gouvernance des données : leur organisation, leur qualité et leur sécurité.
Quelle formation suivre pour devenir data steward ?
Il est possible de devenir data steward avec un niveau bac + 2 minimum. Toutefois, les recruteurs valorisent davantage les profils de niveau bac + 5, issus d’une école d’ingénieurs, d’informatique ou d’un parcours universitaire spécialisé de niveau Master.