Senior SRE Engineer (Site Reliability Engineering)

knowmad Mood
Municipality of Madrid, Spain
2 days ago

Role details

Contract type
Permanent contract
Employment type
Full-time (> 32 hours)
Working hours
Regular working hours
Languages
Spanish

Job location

Remote
Municipality of Madrid, Spain

Tech stack

Java
Agile Methodologies
Amazon Web Services (AWS)
Azure
Prometheus
Service Discovery
Google Cloud Platform
Performance Testing
Grafana
Kubernetes
Docker

Job description

  • Garantizar la fiabilidad y disponibilidad de los servicios en producción aplicando prácticas SRE.
  • Diseñar e implementar monitorización y observabilidad con Prometheus, Grafana y ELK.
  • Gestionar arquitecturas de microservicios, aplicando patrones de resiliencia (circuit breaker, bulkheading, service discovery).
  • Desarrollar y mantener automatizaciones y servicios en Java (8/11) con buenas prácticas de testing.
  • Administrar y optimizar contenedores y despliegues en Docker y Kubernetes.
  • Realizar performance testing, análisis de capacidad y mejora continua del rendimiento.
  • Participar en guardias rotativas y resolución de incidencias críticas, incluyendo post-mortems.
  • Aplicar Chaos Engineering para validar la resiliencia del sistema.
  • Implementar prácticas de AIOps para mejorar la detección y respuesta automatizada de incidentes.
  • Colaborar dentro de un squad multidisciplinar, aportando visión técnica y coordinándose con desarrollo, QA y producto.

Requirements

  • Compromiso, trabajo en equipo y capacidad para comunicar ideas técnicas complejas.
  • Experiencia sólida en monitorización y observabilidad (Prometheus, Grafana, ELK).
  • Conocimiento avanzado en arquitecturas de microservicios y patrones de resiliencia.
  • Dominio de Java 8/11 y prácticas de testing.
  • Experiencia con Docker y Kubernetes.
  • Experiencia en performance testing, resolución de incidencias y guardias on-call.
  • Conocimientos en SRE, Chaos Engineering y AIOps.
  • Perfil claramente senior y acostumbrado a trabajar en squads multidisciplinares., Además, valoraremos muy positivamente si tienes experiencia y/o conocimientos en:
  • Arquitecturas cloud (Azure, AWS o GCP).
  • Gestión avanzada de pipelines CI/CD.
  • Observabilidad de aplicaciones distribuidas a gran escala.
  • Metodologías ágiles y trabajo en squads.
  • Certificaciones en SRE, Kubernetes o cloud.

Benefits & conditions

Contrato Indefinido

100% remoto y flexibilidad horaria

About the company

Somos una compañía líder en transformación digital, en constante evolución y a la vanguardia de la tecnología. Nacimos para provocar un cambio real a través de la innovación y el desarrollo sostenible, con la misión de aportar valor a los clientes e impulsar nuestro talento. Formado por más de 3.000 personas creativas, digitales e innovadoras conectadas a un propósito y capaces de generar conexiones con personas de todo el mundo. Un equipo responsable, flexible y con alta capacidad de adaptación a las necesidades de nuestros clientes y del mercado, a la vez que proporciona valor, visión, creatividad, expertise, profesionalidad y pasión por la tecnología en cada proyecto. Los valores que marcan nuestro rumbo y nos guían hacia la excelencia son la colaboración, la innovación, el compromiso, la diversión y la confianza.

Apply for this position