Sre Gcp H/F
Role details
Job location
Tech stack
Job description
Objectif du recrutement : renforcer l'équipe SRE pour garantir sécurité, fiabilité, scalabilité et gestion efficace des incidents dans un contexte de forte montée en charge. À très court terme, l'équipe SRE devra soutenir :
- la mise en production et sécurisation des APIs de payout pour un lancement client important
- le passage à un environnement critique temps réel
- une plateforme en scale rapide, avec obligations fortes en continuité de service
Rôle : Tu participes à la conception, à l'exploitation quotidienne et à l'amélioration continue d'une plateforme critique, avec une responsabilité directe sur :
- la sécurité
- l'observabilité
- la résilience
- la conformité réglementaire
- la gestion d'incidents
C'est un rôle clé, business-critical, au coeur du produit et non limité à la pure infrastructure. Missions principales : Infrastructure & Scalabilité
- Concevoir, maintenir et faire évoluer l'infrastructure sur Google Cloud Platform (GCP)
- Mettre en place des architectures robustes, tolérantes aux pannes et scalables
- Contribuer au design système et aux choix techniques structurants
Observabilité & Fiabilité
- Développer / améliorer le monitoring, alerting, métriques et logs
- Garantir une forte visibilité sur l'état des systèmes
- Assurer la disponibilité et les performances en environnement temps réel
Sécurité & Conformité
- Garantir la conformité aux exigences réglementaires et environnement régulé
- Participer activement aux incidents de sécurité
- Communiquer avec les parties prenantes en cas d'incident critique
- Travailler main dans la main avec les équipes produit et tech sur les impacts sécurité
Production & Incident Management
- Participation aux astreintes obligatoires
- Gestion des incidents, analyse post-mortem, amélioration continue
- Opération de la plateforme dans un contexte multi-providers / multi-timezones
- Assurer la continuité d'un business où chaque minute compte
Support & Culture SRE
- Supporter les équipes produit / dev sur la CI/CD et les sujets platform
- Diffuser les bonnes pratiques SRE et automatisation
- Participer à la documentation technique
Stack & Environnement :
- Cloud : GCP
- Infra as Code : Terraform
- CI/CD : GitLab CI / GitHub Actions
- Observabilité : Prometheus, Grafana, Datadog, OpenTelemetry
- Culture : ingénierie exigeante, process solides, onsite favorisé pour collaboration forte
Astreintes - Fonctionnement :
- Obligatoires, 1 semaine par astreinte
- Rythme : environ 1 fois par mois
- Rémunération : 520€ pour la semaine de mise à disposition (sans incident) Paiement supplémentaire par intervention Reporting précis des interventions
Enjeu élevé :
- activités critiques
- transactions financières sensibles
- impacts légaux & business immédiats
Requirements
3 à 4+ ans minimum en SRE / Infra
- Expérience GCP solide
- Excellent niveau en CI/CD
- Forte expérience en monitoring / observabilité / incident
- Anglais courant
- Esprit analytique, structuré, rigoureux
- Capacité à challenger et argumenter techniquement
- Expérience dans environnement régulé obligatoire (fintech, santé, télécom ou secteur soumis à fortes contraintes)
Nice to Have
- Expérience cloud security (ex. Prisma, Wiz)
- Event-driven architectures
- Connaissance crypto / blockchain
- Forte sensibilité produit (pas infra only)