Fiche métier Site Reliability Engineer : Derniers freelances inscrits et dernières missions mises en ligne

Qui sont les Site Reliability Engineer inscrits sur Freelance-Informatique.fr ?
+ 1 000 Site Reliability Engineer
freelance inscrits
36 ans Age
moyen
510€ - 670€ Tarif Journalier
Moyen
Je trouve mon freelance
Je cherche une mission

Le métier de Site Reliability Engineer

Une carrière de Site Reliability Engineer est devenue possible au début des années 2000, lorsque des professionnels de la technologie ont veillé à ce que le moteur de recherche Google soit plus fiable et plus évolutif à mesure que sa base d'utilisateurs augmentait. Aujourd'hui, les ingénieurs en fiabilité de sites sont des professionnels DevOps spécialisés dans la gestion des processus impliqués dans le fonctionnement des sites web. Ils jouent un rôle similaire à celui des ingénieurs DevOps, bien que les candidats à l'emploi puissent se démarquer en tant que SRE en se concentrant davantage sur le contrôle et l'assurance de la qualité.

À retenir :

  • Le métier de SRE implique diverses missions clés : la conception de logiciels, la documentation, l'évaluation post-résolution, le traitement des datas, la conception de la configuration et l'optimisation de la charge de travail.
  • Pour réussir en tant que SRE, l’ingénieur doit savoir coder, gérer les versions et les changements, et avoir desaptitudes en matière de cloud et de bases de datas
  • Le Site Reliability Engineer doit également posséder des aptitudes comportementales, telles qu’un bon sens de la communication et unesprit d'investigation.

Qu’est-ce qu’un Site Reliability Engineer ?

Un Site Reliability Engineer (SRE), aussi appelé ingénieur de fiabilité de site en français, est une personne qui applique les pratiques de l'ingénierie logicielle aux tâches d'exploitation informatique afin de maintenir un environnement de production évolutif et fiable pour l'exécution de service logiciel.

L'objectif principal de cet ingénieur est de rationaliser la gestion de l'infrastructure informatique en utilisant le code, les logiciels et l'automatisation.

Il contribue à minimiser autant que possible les efforts manuels et à assurer la fiabilité du site afin que l'entreprise puisse exploiter une multitude de nouvelles applications et de nouveaux services en garantissant la fiabilité des sites et applications en question.

Quel est le rôle d’un Site Reliability Engineer ?

Un Site Reliability Engineer veille à ce qu'un site web existant fonctionne de manière fluide, efficace et fiable.

Cela est particulièrement important pour les sites web à grande échelle qui comptent un grand nombre d'utilisateurs et où les temps d'arrêt peuvent être extrêmement coûteux et perturber l'activité de l'entreprise.

L’emploi de SRE implique de travailler avec les développeurs, les clients et les unités commerciales pour comprendre leurs besoins et leurs attentes. Il crée ensuite une conception back-end de haute qualité qui garantit une meilleure convivialité pour les utilisateurs.

En outre, les SRE sont également chargés de créer des solutions et des processus de surveillance en cas de problème.

Les missions d’un Site Reliability Engineer

L’emploi de SRE exige une compréhension stratégique et pratique de plusieurs fonctions différentes.

Connaissance du développement de logiciels

Les SRE constituent une alternative durable et plus intelligente aux responsables traditionnels des technologies de l'information et des sites de produits, qui s'appuient sur des processus manuels et itératifs.

Pour améliorer le système existant, le Site Reliability Engineer doit développer un logiciel utile et adapté. Par exemple, un ingénieur en fiabilité de site peut être chargé de créer un outil d'alertes automatisées sur des dispositifs portables en partant de zéro.

Prise en charge de la remontée des incidents et le dépannage

L'escalade des incidents se produit lorsqu'un problème dans l'environnement de production ne peut être résolu par les interventions de niveau 1 et 2.

Les SRE interviennent donc à un stade plus avancé afin de pouvoir déployer des solutions innovantes pour résoudre les problèmes critiques. Ils doivent également documenter l'incident et développer des réponses automatisées pour éviter que des escalades similaires ne se produisent à l'avenir.

Documentation des processus et des connaissances

Travaillant régulièrement avec des équipes interfonctionnelles, l’ingénieur acquiert au fil du temps un corpus de connaissances considérables, qui n'est souvent pas documenté.

C'est pourquoi le SRE est chargé de mettre en place une documentation interne, des playbooks et d'autres référentiels de connaissances consolidées qui peuvent aider les équipes existantes et les futures personnes embauchées.

Évaluation des incidents après leur résolution

L'un des principes fondamentaux du Site Reliability Engineer est une "culture post-résolution". Cela signifie qu’il ne peut pas se contenter de clore un problème ou un incident une fois qu'il est résolu.

En effet, le SRE enquête sur les faits et les événements qui ont conduit à un incident afin d'éviter que des pannes similaires ne surviennent à nouveau.

Gestion de la charge

Le SRE vise à assurer la disponibilité du service autant que possible. En effet, le SRE doit mettre en œuvre des techniques telles que les interrupteurs d'arrêt et les dérogations manuelles qui interviendront si une solution automatisée ne fonctionne pas correctement.

En règle générale, l’ingénieur est responsable d'un système de gestion de la charge à trois volets comprenant l'équilibrage de la charge, le délestage de la charge et la mise à l'échelle automatique.

Compréhension des pipelines de traitement des données

Le Site Reliability Engineer doit concevoir des pipelines de traitement des datas qui convertissent ces ensembles de données fragmentés et non ordonnés en informations structurées afin d'alimenter les fonctions des applications ou d'éclairer la prise de décision.

Compétence en matière de conception de configuration

Un des rôles du SRE est de gérer la configuration des produits logiciels, des ensembles de données et des systèmes de production qui exécutent les services.

La conception de la configuration doit donner la priorité à deux facteurs : la simplicité, afin que les futures équipes SRE puissent adapter le système avec un minimum d'efforts, et la fiabilité, pour que les utilisateurs puissent bénéficier d'une haute disponibilité et de services d'application ininterrompus.

Salaire et TJM d’un Site Reliability Engineer

D’après les différentes offres d’emploi, en France, le salaire annuel brut d’un Site Reliability Engineer débutant et en CDI s’élève à environ 50 000 euros.

Cependant, attention, ce salaire peut considérablement varier en fonction de la taille de l’entreprise par laquelle l’ingénieur est employé et de son expérience.

Sachez qu’après 20 ans d’expérience, le SRE peut toucher, en France, un salaire de plus de 90 000 euros brut par mois. À Paris et dans ses alentours, le revenu est 10 à 15 % supérieur par rapport aux autres régions de France.

Le Site Reliability Engineer peut aussi être en freelance. Si c’est le cas et qu’il vient de commencer sa carrière, son Taux Journalier Moyen varie entre 350 euros et 500 euros environ en province. Cela peut monter jusqu’à 600 euros à Paris et ses environs.

Quelles sont les compétences d’un Site Reliability Engineer ?

Site Reliability Engineer est un emploi qui demande un certain nombre d’aptitudes techniques, mais également comportementales.

Hard Skills (Compétences techniques)

  • Codage expert : pratiquement tous les aspects du métier de SRE, de la configuration au développement du logiciel, dépendent de la capacité à écrire un code efficace et sans erreurs. 
  • Conception d’un logiciel complet : cette aptitude permet au SRE d'aborder la gestion de l'infrastructure sous différents angles. 
  • Cloud et bases de data : le SRE doit posséder des aptitudes d'expert en termes de gestion de l'informatique afin d'orchestrer les ressources informatiques disponibles pour un temps de fonctionnement maximal. Il faut aussi connaître les bases de data fonctionnant sur des pipelines SQL et NoSQL.
  • Approche DevOps : l'ingénierie de la fiabilité des sites et DevOps sont étroitement liés. Il est donc utile d'avoir des aptitudes et une expérience DevOps lorsqu'on postule à un poste de SRE.

Soft Skills  (Compétences comportementales)

  • Excellentes aptitudes en communication : à l'instar de l’ingénieur DevOps, le métier de SRE est également interfonctionnel. Il doit régulièrement collaborer avec les équipes d'assistance aux utilisateurs.
  • Un esprit d'investigation : l’ingénieur ne se contente pas de résoudre efficacement les problèmes. Il doit aussi être capable d'en rechercher la cause profonde, de retracer les différents facteurs qui ont conduit à l’incident, de rechercher des indices et, enfin, de dresser un tableau complet de ce qu’il s'est passé.
  • La capacité à penser différemment : elle permet à l'ingénieur de mettre en œuvre des solutions innovantes pour relever les défis opérationnels, de sorte que les processus deviennent plus efficaces, plus légers et exempts d'erreurs.

Quelles sont les technologies/outils dont se sert un Site Reliability Engineer ?

  • Systèmes de surveillance générale : le SRE utilise les outils APM et de surveillance pour capturer, mesurer et suivre les mesures de fiabilité dans l'ensemble de l'environnement, tels que Datadog et Kibana. 
  • Systèmes automatisés de réponse aux incidents : les équipes SRE doivent mettre en place des mesures préventives qui protègent les systèmes contre les défaillances et les protègent lorsqu'une défaillance se produit avec par exemple PagerDuty et VictorOps. 
  • Outils de gestion de la configuration : les SRE utilisent des systèmes de gestion de la configuration pour suivre les modifications apportées aux applications, prévenir et surveiller les changements non autorisés, et automatiser les déploiements afin de les rendre prévisibles et fiables (Terraform et Ansible).

Quels sont les métiers similaires à celui de Site Reliability Engineer ?

Il existe plusieurs métiers similaires à l’emploi de Site Reliability Engineer. Parmi ces professions, on retrouve :

  • Cloud Engineer : il participe à la conception, à la planification et au développement d'applications et de bases de data.
  • Platform Engineer : il conçoit et maintient toutes les activités de nomination des ordinateurs de bureau et des postes séparés, aide à l'installation des modèles et prépare des scripts pour tous les développements de logiciels.
  • DevOps Manager : il supervise la mise en œuvre, le déploiement et l'intégration de solutions. Il planifie, construit, configure et teste également les solutions, assure la maintenance des systèmes, analyse et approuve le nouveau code et effectue des tâches d'automatisation.

Si vous souhaitez vous reconvertir, vous pouvez aller consulter les offres d’emploi de ces métiers et jeter un œil sur leur processus de recrutement.

Vous êtes freelance ?
Sécurisez votre activité grâce au portage salarial !

Exemple de missions de Pierre,
Site Reliability Engineer habitant l'Essonne (91)

  • Site Reliability Engineer

    STIME, France
    Jan 2022 - aujourd'hui

    Maintenance et évolution de la plateforme Openshift 4
    ∠ Mise en place du Chaos engineering dans la plateforme Openshift
    ∠ Migration de la plateforme AWX vers Ansible Tower/AAP
    ∠ Prévention des risques liés à la sécurité des applications sous Openshift (mise en place Vault, Sentinel, OPA)
    ∠ Administration stockage Ceph
    ∠ Développement de playbooks Ansible pour le déploiement d’applications sur Openshift
    ∠ Développement de charts compatibles Openshift (Helm/gotpl)
    ∠ Gestion des incidents liés à l’ensemble des composants de la stack CI/CD
    ∠ Administration Gitlab CI
    ∠ Automatisation du déploiement des runners
    Openshift Kubernetes Go Python Shell Gitlab Ansible Terraform Gitlab CI Ceph Harbor Litmus
    Prometheus Thanos

  • Site Reliability Engineer

    CARREFOUR, France
    Jan 2021 - Jan 2022

    Développement du processus de release management
    ∠ Mise en place de la code quality (semver, hooks, pre-commits, reject on lint failure, git flow)
    ∠ Développement de l’infrastructure vpod IAAS, PAAS, CAAS sur GCP / Azure via Terraform / Ansible
    ∠ Tests unitaires, tests d’intégration, créations de packages infra (Golang, Rust)
    ∠ Tests Kubernetes (Terratest)
    ∠ Déploiements charts Kubernetes (Helmfile)
    ∠ Containerisation d’outils liés aux besoins métiers
    ∠ Créations de macro-modules Terraform pour Azure / GCP
    ∠ Développement d’un outil d’administration des bases de données multi cloud-providers (Golang)
    ∠ Administration Jenkins
    Kubernetes GCP Go Ansible Rust Terraform MS Azure Jenkins Python Nexus BitBucket git flow

  • Développeur Infrastructure

    HEALTH DATA HUB, France
    Jan 2021 - Jan 2021

    Développement d’une pipeline d’ingestion de données (Golang)
    ∠ Développement de l’infrastructure immutable MS Azure dans Terraform
    ∠ Mise en place de services containerisés (Jupyter, Gitea, Nexus) dans Kubernetes
    ∠ Tests unitaires, tests d’intégration (Golang)
    ∠ Tests Terraform, Kubernetes (Terratest)
    ∠ Scripting Shell (custom jobs, scripts de configuration des instances)
    ∠ Hardenning des images de VM
    ∠ Firewalling Azure
    ∠ Evolution de l’architecture de la plateforme
    Kubernetes Go Terraform Ansible MS Azure Azure Pipelines Packer Nexus Gitlab JupyterLab Gitea
    golint shellcheck R Studio Python

  • Manager Support Production Energie - Ingénieur Systèmes

    TOTAL DIRECT ENERGIE, France
    Jan 2020 - Jan 2021

    Configuration de pipeline CI / CD (Jenkins, Travis)
    ∠ Containerisation d’applications via Docker.
    ∠ Déploiement automatisé via Terraform
    ∠ Centralisation/automatisation de la gestion du parc et du déploiement d’applications via Puppet/Foreman et Ansible (environ 900 Vms).
    ∠ Suivi et montée en compétence des collaborateurs de l’équipe
    ∠ Planification de l’activité du pôle
    ∠ MCO infra et applicative sur les serveurs et applications du pôle
    ∠ Participation aux phases de suivi (COTECH, présentations) des infogéreurs (EasyTeam, Proservia)
    ∠ Suivi et réalisation des projets du pôle Energie de la conception à la mise en production
    ∠ Administration des bases de données PostgreSQL
    ∠ Conception de référentiels et d’outils pour la DSI
    VmWare vCenter RHEL PostgreSQL Oracle Bash Netapp Puppet Foreman Jenkins Terraform Ansible
    Docker MS Azure Nexus Elastic Stack Sciencelogic Dynatrace Apache Tomcat SpringBoot

  • Administrateur Systèmes et Réseaux

    DIRECT-ENERGIE, France
    Jan 2018 - Jan 2020

    MCO (prise en charge des incidents de production, remédiation des alertes détectées par la supervision)
    ∠ Gestion des demandes
    ∠ Gestion de la MCO des machines Puppetisées et développements de modules Puppet
    ∠ Participation aux phases projets (rebranding TDE, Soprano, Toucan Toco)
    ∠ Scripting Bash, mise en place de routines automatisées
    ∠ Mise en place du Nuance Transcription Engine pour la partie Infra (GRP Awards 2019 B to C Winner |
    Projet Soprano)
    ∠ Rédaction de procédures d’exploitation (DEX/MEX/KB)
    ∠ Référent Devops pour le pôle solution Energie
    ∠ Participation à l’astreinte exploitation et réalisation des mises en production
    VmWare vCenter RHEL Netapp Bash Puppet Jenkins Ansible Docker MS Azure Elastic Stack Sciencelogic
    Dynatrace Fortigate Cisco UCS Apache Tomcat SpringBoot

  • Administrateur Systèmes et Réseaux

    DIRECT-ENERGIE
    Jan 2018 - Jan 2018

    MCO (prise en charge des incidents de production, gestion des demandes)
    ∠ Filtrage applicatif next-gen (Palo Alto Networks)
    ∠ Mise en place de VPNs partenaires
    ∠ Filtrage externe (Watchguard)
    ∠ Prise en main de la supervision infra
    ∠ Administration des bornes Wifi
    ∠ Enrichissement de la base documentaire
    VmWare vCenter RHEL Watchguard Palo Alto Networks Cisco Catalyst Netapp Puppet Jenkins Sciencelogic

  • Consultant IT,

    HELPLINE, France
    Jan 2017 - Jan 2018

    Administrateur Systèmes pour CRÉDIT AGRICOLE AMUNDI
    Au sein d’un site sécurisé destiné à la poursuite de l’activité en cas de sinistre, mon rôle a été d’assister le
    RPCA du site en assurant la maintenance des installations informatiques en conditions opérationnelles.
    ∠ Reporting d’analyse des risques du SI
    ∠ Déploiement des images master en multicast
    ∠ Administration d’un serveur de production TinyCore Linux
    ∠ Planification de tâches (Cron, Anacron)
    ∠ Evolutions et corrections : analyse, conception et développement
    ∠ Scripting Bash, mise en place de conventions de code
    ∠ Rédaction des procédures techniques du master
    VmWare vCenter Bash Tiny Core Linux Clonezilla HP Pro Desk 600 HP Elite Desk 800

  • Technicien Bureautique | Support utilisateurs

    CRÉDIT AGRICOLE SILCA, CASA, CAPS, CACIB
    Jan 2016 - Jan 2017

    Au sein de la Boutique IT du campus, j’ai été en charge de l’acceuil et du support technique des utilisateurs
    des entités du Crédit Agricole. J’ai également accompagné les utilisateurs dans la prise en main de leur
    environnement mixte (Citrix / Windows) lors des projets de migrations internes.
    ∠ Gestion des demandes et incidents Bureautique
    ∠ Masterisation de postes
    ∠ Administration VDI Citrix
    ∠ Scripting Powershell
    Formations réalisées au cours de la mission :
    ∠ Conflits d’Intérêts FRA 14000
    ∠ Cybersecurity basics [2017] FRA 14000
    ∠ Secu’Training for Prod (Sécurité IT pour Ops) [2016]
    VmWare Horizon Citrix Windows 7/10 Powershell DELL Latitude

Voir le profil complet de ce freelance

Les nouveaux profils de Site Reliability Engineer

CV DevOps / SRE
Alexis

DevOps / SRE

  • MONTPELLIER
Kubernetes Cloud AWS AZURE LINUX GRAFANA DEVOPS DOCKER CI/CD HASHICORP TERRAFORM
Disponible
CV Ingénieur système
Chakib

Ingénieur système

  • CRÉTEIL
LINUX REDHAT WINDOWS SERVER 2016 Kubernetes VMWARE SCRIPT SHELL BIG-IP IBM PLATFORM CLOUD SERVICES ANSIBLE DOCKER
Disponible
CV Azure Solution Architecte et Senior DEVOPS
Babacar

Azure Solution Architecte et Senior DEVOPS

  • ROSNY-SOUS-BOIS
DEVOPS Kubernetes DOCKER ANSIBLE AZURE LINUX PYTHON Cloud AWS HASHICORP TERRAFORM JENKINS
CV Site Reliability Engineer / DevOps
Pierre

Site Reliability Engineer / DevOps

  • ARPAJON
LINUX DOCKER Kubernetes Google Cloud Platform SCRUM POSTGRES Cloud AWS REDHAT OPENSHIFT GO PYTHON
CV Ingénieur de développement Back-End
Guillaume

Ingénieur de développement Back-End

  • AUBAGNE
DOCKER PYTHON GIT Google Cloud Platform Cloud AWS
CV DevOps /AWS/Azure/GCP/Cloud Architect/
Ould Hammou

DevOps /AWS/Azure/GCP/Cloud Architect/

  • BIOT
Google Cloud Platform JENKINS AZURE VMWARE DOCKER Cloud AWS LINUX PYTHON GRAFANA REDHAT
CV DevOps / SRE
Edim

DevOps / SRE

  • Wasquehal
LINUX WINDOWS SERVER 2016
CV Administrateur système TSM
Ahmed Khalil

Administrateur système TSM

  • PARIS
TSM IBM SAN UNIX AIX VMWARE VSPHERE LINUX EMC IBM BLADECENTER IBM SYSTEM X
CV Consultant DevOps/Cloud en télétravail total
Ludovic

Consultant DevOps/Cloud en télétravail total

  • Noisy-le-grand
UNIX AIX Kubernetes DOCKER LINUX SHELL UNIX UNIX SOLARIS HASHICORP VAULT HASHICORP TERRAFORM ANSIBLE PYTHON
CV DevOps Kubernetes
Yves-Marie

DevOps Kubernetes

  • PARIS
Kubernetes Google Cloud Platform
Je trouve mon Site Reliability Engineer freelance

Les nouvelles missions de Site Reliability Engineer

Ingénieur Fiabilité des Sites (SRE)

PYTHON AZURE Cloud AWS Google Cloud Platform BASH
ASAP
69 - LYON
12 mois
Voir la mission

Site Reliability Engineer

LINUX AZURE
ASAP
06 - NICE
36 mois
Voir la mission
Je trouve ma mission de Site Reliability Engineer freelance