Le SRE c'est un titre de poste qui a caché pas mal de chose pendant longtemps. Certains l'on pris au sens littéral, et ceux qui étaient responsables de la disponibilité des applications sont devenus SRE. C'était finalement des administrateurs systèmes avec un nouveau nom.
SRE c'est une méthode, qui vient comme une spécificité du DevOps
La méthode a été formalisée dans un livre par des salariés de Google et est devenue rapidement populaire. Elle est intéressante aussi parce qu'elle va faire réfléchir aux risques physiques que peut voir une application : incendies, panne de courant, panne de réseau. Est-ce que c'est utile d'être multi-AZ ? Tout un vocable qui va au dela du SLA (le pourcentage de temps où l'application a été disponible).
Le SRE est connu pour être transversal dans l'entreprise. Il faut communiquer en interne beaucoup, avoir une posture facilitatrice. Parce qu'un bon DRP (Disaster Recovery Plan) ou un bon PCA (Plan de Continuité de l'Activité), n'est pas centralisé. Si le SRE prend toute cette responsabilité, il devient un SPOF (Single Point Of Failure).
Alors le bon SRE, distribue les responsabilités et s'assure que tout le monde ait les moyens de les assumer. Sinon iel travaille à les trouver. Et quand on pense que l'on a pensé à tout, le SRE continue de chercher d'où pourrait venir le prochain problème.
Son outil favoris ? Les logs ! L'observabilité des systèmes est son premier cheval de bataille. Il faut savoir ce qu'il se passe dans le Cloud ou dans le Datacenter.
En matière d'amélioration continue, notre SRE va éplucher des frictions logs pour trouver ce qui pourrait devenir un problème demain ou ce qui peut être amélioré aujourd'hui.
Derrière une annonce ou une fiche de poste SRE il y a beaucoup de métiers ou de variantes possibles. Il faut vraiment creuser pour en savoir plus.
Je trouve que celle qui incarne le mieux ce métier c'est Gaëlle Acas et elle en parle super bien dans cette interview sur le Podcast de WeLoveDevs ⬇️
Si vous avez lu cette fiche métier, il faut vraiment que vous lisiez celle du DevOps ensuite !