En tant qu’expert.e Observabilité, vous intervenez pour structurer, faire évoluer et refondre les dispositifs d’observabilité autour de Grafana, Prometheus et des écosystèmes Kubernetes / OpenShift.
Votre rôle
Gouvernance et pilotage de l’observabilité
Définir et porter la vision cible de l’observabilité (metrics, logs, traces, alerting, corrélation)
Concevoir et faire évoluer les standards de supervision et d’observabilité (KPIs, SLO, alerting, dashboards)
Garantir l’alignement entre enjeux techniques, applicatifs et métiers, avec une approche bout en bout du SI
Structurer les pratiques dans une logique SRE / DevOps / industrialisation
Refonte de la supervision et transformation des outils
Contribuer au projet de refonte de la supervision basé sur Zabbix, Grafana, Prometheus et OpenShift
Définir les architectures de collecte, de stockage et de visualisation de la télémétrie
Structurer la supervision des clusters Kubernetes / OpenShift
Piloter la convergence entre les dispositifs existants et la cible
Exploitation et support niveau 3
Administrer, configurer et optimiser les plateformes d’observabilité
Assurer un support expert N3, notamment sur les incidents complexes
Analyser les causes racines et contribuer à la réduction du bruit et des alertes non pertinentes
Automatisation, industrialisation et collaboration
Automatiser le déploiement des composants d’observabilité (Helm, Operators, Ansible, Terraform)
Intégrer l’observabilité dans les chaînes CI/CD et les environnements OpenShift