Senior SRE Engineer - Cloud Operations
Senior SRE Engineer - Cloud Operations
Senior SRE Engineer - Cloud Operations
Senior SRE Engineer - Cloud Operations
Jobriver HR Service
Internet, IT
Berlin
- Art der Beschäftigung: Vollzeit
- 66.500 € – 87.000 € (von XING geschätzt)
- Hybrid
- Zu den Ersten gehören
Senior SRE Engineer - Cloud Operations
Über diesen Job
Senior SRE Engineer - Cloud Operations
Beschreibung
Das Unternehmen ist ein innovativer Anbieter im Bereich der Vektordatenbanken und hat sich zum Ziel gesetzt, die Art und Weise, wie Organisationen unstrukturierte Daten verwalten und abfragen, zu revolutionieren. Mit einer offenen Engine und verwalteten Cloud-Lösungen ermöglicht es KI-gesteuerte Suchen, Empfehlungen und Datenentdeckungen in großem Maßstab. Als Senior SRE Engineer im Cloud Operations-Team sind Sie verantwortlich für die Zuverlässigkeit, Beobachtbarkeit und Sicherheit der Cloud-Dienste des Unternehmens, während die Nutzung und die Komplexität der Infrastruktur zunehmen. Ihre Hauptverantwortung liegt in der operativen Exzellenz, die Stabilität, Incident-Response und kontinuierliche Verbesserung der Produktionssysteme umfasst. In dieser operationsintensiven Rolle sind Sie ideal für Ingenieure, die Verantwortung für die Zuverlässigkeit übernehmen und operationale Risiken im großen Maßstab reduzieren möchten. Zu Ihren Aufgaben gehören unter anderem der Betrieb und die Wartung der Produktions-Cloud-Infrastruktur, das Management der Kubernetes-Infrastruktur sowie die Verbesserung von Monitoring, Logging und operativer Sichtbarkeit. Sie werden eng mit den Plattform-Teams zusammenarbeiten und an der kontinuierlichen Verbesserung der Zuverlässigkeit teilnehmen. Das Unternehmen bietet Ihnen die Möglichkeit, in einem flexiblen, remote-orientierten Arbeitsumfeld zu arbeiten, in dem Sie Ihre Fähigkeiten in einem dynamischen Team weiterentwickeln können.
Anforderungen
Der ideale Kandidat bringt mindestens 5 Jahre Erfahrung in DevOps, SRE oder Infrastruktur-Operations mit. Sie sollten über fundierte praktische Kenntnisse im Betrieb von Kubernetes in Produktionsumgebungen verfügen und ein solides Wissen über Linux-Systeme, Netzwerke und Cloud-Infrastrukturen mitbringen. Erfahrungen mit AWS, GCP oder Azure sind ebenfalls erforderlich. Ein starkes Verständnis für Monitoring, Alerting und Incident Management ist von Vorteil, ebenso wie Kenntnisse in Infrastructure-as-Code und Automatisierungstools. Sie sollten bereit sein, On-Call-Verantwortlichkeiten zu übernehmen und in der Lage sein, Produktionsvorfälle klar zu kommunizieren. Wünschenswert sind Erfahrungen mit Terraform oder ähnlichen IaC-Tools sowie Kenntnisse in Prometheus, Grafana, Loki oder OpenTelemetry. Scripting-Kenntnisse in Python, Bash oder Go sowie Erfahrungen in SaaS-, Cloud- oder Dateninfrastrukturumgebungen sind ebenfalls von Vorteil. Persönlich sollten Sie eine starke operationale Denkweise und ausgezeichnete Kommunikationsfähigkeiten mitbringen.