Staff Site Reliability Engineer

Jobriver HR Service

Internet, IT

München

Art der Beschäftigung: Vollzeit
69.500 € – 110.000 € (von XING geschätzt)
Vor Ort
Aktiv auf der Suche

Über diesen Job

Staff Site Reliability Engineer

München

Vor Ort

Vollzeit

Senior

vor 40 Tagen

54.000 € – 74.000 € / Jahr

Beschreibung

Das Unternehmen ist ein führender Anbieter im Bereich Prozessintelligenz und zählt zu den am schnellsten wachsenden SaaS-Firmen weltweit. In dieser Rolle sind Sie Teil eines Teams, das für die Gesundheit und Zuverlässigkeit der Produkte verantwortlich ist, was entscheidend für den Erfolg des Unternehmens ist. Ihre Hauptaufgaben umfassen die kontinuierliche Verbesserung von Monitoring und Metriken für alle Dienste sowie die Definition und Implementierung fehlender Service Level Objectives (SLOs). Sie setzen Prozesse und Automatisierungen um, um die Wiederholung von Problemen zu verhindern und dokumentieren das erworbene Wissen. Zudem sind Sie der Champion der Zuverlässigkeit innerhalb der Organisation und fördern eine Kultur der Site Reliability Engineering (SRE). Sie sind verantwortlich für den Vorfallmanagementprozess und leiten eine blameless Lessons Learned-Kultur ein. Darüber hinaus treiben Sie den Wissensaustausch zwischen den Teams voran und arbeiten eng mit anderen Teams zusammen, um zuverlässige und resiliente Dienste zu entwickeln. Das Arbeitsumfeld ist dynamisch und international, was Ihnen die Möglichkeit gibt, mit talentierten Individuen zusammenzuarbeiten und Ihre Ideen in einer offenen Kultur einzubringen. Es erwarten Sie klare Karrierewege und umfangreiche Weiterbildungsmöglichkeiten.

Anforderungen

Der ideale Kandidat bringt umfangreiche Erfahrung im Bereich SRE mit, gepaart mit einem hervorragenden Hintergrund in der Softwareentwicklung, typischerweise mindestens 10 Jahre Berufserfahrung. Sie sollten über ausgezeichnete Kommunikations- und Teamfähigkeiten verfügen sowie eine proaktive Einstellung mit nachweislichen Erfolgen in der Leitung und Umsetzung von Projekten. Programmierkenntnisse in Java und Spring Boot sind erforderlich, Kenntnisse in Python oder einer ähnlichen Skriptsprache im Linux-Umfeld sind von Vorteil. Zudem sollten Sie gute Erfahrungen im Umgang mit großflächigen verteilten Systemen sowie fundierte praktische Kenntnisse in Kubernetes und den großen Cloud-Anbietern wie AWS und Azure mitbringen. Erfahrung mit Monitoring- und Observability-Lösungen, wie beispielsweise Datadog, ist ebenfalls wünschenswert. Persönliche Eigenschaften wie Teamfähigkeit, analytisches Denken und eine lösungsorientierte Denkweise runden Ihr Profil ab.

Technologien

Python Java Spring Boot Kubernetes AWS Azure

Soft Skills

Teamfähigkeit Kommunikation Analytisches Denken

Erforderliche Sprachen

Deutsch Englisch

Ähnliche Jobs

System Engineer/Site Reliability Engineer (m/w/d)

System Engineer/Site Reliability Engineer (m/w/d)

(Senior) Site Reliability Engineer (m/w/d) - remote

(Senior) Site Reliability Engineer (m/w/d) - remote

System Engineer/Site Reliability Engineer (m/w/d) | OMCOPA

System Engineer/Site Reliability Engineer (m/w/d) | OMCOPA

System Engineer/Site Reliability Engineer (m/w/d)

System Engineer/Site Reliability Engineer (m/w/d)

(Senior) Site Reliability Engineer (m/w/d) - remote

(Senior) Site Reliability Engineer (m/w/d) - remote

System Engineer/Site Reliability Engineer (m/w/d) | OMCOPA

System Engineer/Site Reliability Engineer (m/w/d) | OMCOPA

Staff Site Reliability Engineer