Staff Site Reliability Engineer
Staff Site Reliability Engineer
Staff Site Reliability Engineer
Staff Site Reliability Engineer
Jobriver HR Service
Internet, IT
München
- Art der Beschäftigung: Vollzeit
- 69.500 € – 110.000 € (von XING geschätzt)
- Vor Ort
- Zu den Ersten gehören
Staff Site Reliability Engineer
Über diesen Job
Staff Site Reliability Engineer
Beschreibung
Das Unternehmen ist ein führender Anbieter im Bereich Prozessintelligenz und zählt zu den am schnellsten wachsenden SaaS-Firmen weltweit. In dieser Rolle sind Sie Teil eines Teams, das für die Gesundheit und Zuverlässigkeit der Produkte verantwortlich ist, was entscheidend für den Erfolg des Unternehmens ist. Ihre Hauptaufgaben umfassen die kontinuierliche Verbesserung von Monitoring und Metriken für alle Dienste sowie die Definition und Implementierung fehlender Service Level Objectives (SLOs). Sie setzen Prozesse und Automatisierungen um, um die Wiederholung von Problemen zu verhindern und dokumentieren das erworbene Wissen. Zudem sind Sie der Champion der Zuverlässigkeit innerhalb der Organisation und fördern eine Kultur der Site Reliability Engineering (SRE). Sie sind verantwortlich für den Vorfallmanagementprozess und leiten eine blameless Lessons Learned-Kultur ein. Darüber hinaus treiben Sie den Wissensaustausch zwischen den Teams voran und arbeiten eng mit anderen Teams zusammen, um zuverlässige und resiliente Dienste zu entwickeln. Das Arbeitsumfeld ist dynamisch und international, was Ihnen die Möglichkeit gibt, mit talentierten Individuen zusammenzuarbeiten und Ihre Ideen in einer offenen Kultur einzubringen. Es erwarten Sie klare Karrierewege und umfangreiche Weiterbildungsmöglichkeiten.
Anforderungen
Der ideale Kandidat bringt umfangreiche Erfahrung im Bereich SRE mit, gepaart mit einem hervorragenden Hintergrund in der Softwareentwicklung, typischerweise mindestens 10 Jahre Berufserfahrung. Sie sollten über ausgezeichnete Kommunikations- und Teamfähigkeiten verfügen sowie eine proaktive Einstellung mit nachweislichen Erfolgen in der Leitung und Umsetzung von Projekten. Programmierkenntnisse in Java und Spring Boot sind erforderlich, Kenntnisse in Python oder einer ähnlichen Skriptsprache im Linux-Umfeld sind von Vorteil. Zudem sollten Sie gute Erfahrungen im Umgang mit großflächigen verteilten Systemen sowie fundierte praktische Kenntnisse in Kubernetes und den großen Cloud-Anbietern wie AWS und Azure mitbringen. Erfahrung mit Monitoring- und Observability-Lösungen, wie beispielsweise Datadog, ist ebenfalls wünschenswert. Persönliche Eigenschaften wie Teamfähigkeit, analytisches Denken und eine lösungsorientierte Denkweise runden Ihr Profil ab.