Site Reliability Engineer - Automatisierung / Python / Ansible (m/w/d)
Site Reliability Engineer - Automatisierung / Python / Ansible (m/w/d)
Site Reliability Engineer - Automatisierung / Python / Ansible (m/w/d)
Site Reliability Engineer - Automatisierung / Python / Ansible (m/w/d)
Workwise GmbH
Internet, IT
Berlin
- Verifizierte Job-Anzeige
- Art der Anstellung: Vollzeit
- 51.000 € – 74.000 € (von XING geschätzt)
- Hybrid
Site Reliability Engineer - Automatisierung / Python / Ansible (m/w/d)
Über diesen Job
Über IONOS SE
Wir sind Europas führende Plattform für Cloud Services und Hosting-Dienstleistungen. Wir begleiten erfolgreich unsere Kund:innen bei ihrer Unternehmensentwicklung. Für unseren Unternehmenserfolg sind über 4000 Mitarbeitende in mehreren Ländern weltweit tätig, um die Anforderungen und Wünsche unserer 8,5 Millionen Kund:innen zu erfüllen.
Wir sind eine Marke der United Internet AG, einem börsennotierten Unternehmen mit rund 10.200 Mitarbeitenden.
Wir fördern die Entwicklung unserer Mitarbeitenden und deren unterschiedliche Talente, Interessen und Sprachen.
Wir sind eine Marke der United Internet AG, einem börsennotierten Unternehmen mit rund 10.200 Mitarbeitenden.
Wir fördern die Entwicklung unserer Mitarbeitenden und deren unterschiedliche Talente, Interessen und Sprachen.
Was erwartet dich?
- Du nimmst an Architektur-Reviews teil, um sicherzustellen, dass die Speicher-Infrastructure die Ziele für Leistung, Zuverlässigkeit und Skalierbarkeit erreicht
- Du entwickelst Automatisierungen für die Speicher-Provisionierung, das Monitoring und die Skalierung – zum Beispiel mit Ansible, SaltStack, Terraform oder eigenen Python/Go-Skripten
- Du richtest Self-Healing- und Alarmierungs-Mechanismen ein, die bei speicherbezogenen Problemen automatisch reagieren
- Du implementierst Observability für die Speichersysteme (Metriken, Logs, Tracing)
- Du analysierst und behebst komplexe Leistungs- oder Zuverlässigkeits-Probleme und unterstützt die On-Call-Rotation
- Du führst Root-Cause-Analysen (RCA) für Vorfälle durch und entwickelst präventive Maßnahmen
Was solltest du mitbringen?
- Du hast mindestens 5 Jahre Erfahrung in Linux-Systemengineering, Speicher-Infrastructure oder SRE-Rollen
- Du hast ein sehr gutes Verständnis der Protokolle RDMA, InfiniBand und RoCE
- Du hast fundierte Praxis mit Linux MD-RAID (mdadm) und LVM
- Du hast Erfahrung im Linux-Performance-Tuning und im Debuggen des Netzwerk-Stacks (ethtool, perf, tcpdump, ibstat, ibtop)
- Du hast starke Scripting- und Automatisierungs-Skills in Python, Bash und Go
- Du bist sicher im Umgang mit Konfigurations-Management-Tools wie SaltStack oder Ansible sowie mit Monitoring-Lösungen wie Prometheus, Loki und Grafana
Was bieten wir dir?
- Hybrides Arbeitsmodell mit Homeoffice-Möglichkeit
- Flexible Arbeitszeiten durch Vertrauensarbeitszeit
- An einigen Standorten eine bezuschusste Kantine und verschiedene kostenfreie Getränke
- Moderne Büroflächen mit sehr guter Verkehrsanbindung
- Diverse Mitarbeiterrabatte für Aktivitäten und Produkte
- Mitarbeiterevents wie Sommer- und Winterfeiern, sowie Workshops
- Zahlreiche Weiterbildungs- und Entwicklungsmöglichkeiten
- Verschiedene Gesundheitsangebote, wie Sport- und Gesundheitskurse
Zur Bewerbung
Unser Jobangebot Site Reliability Engineer - Automatisierung / Python / Ansible (m/w/d) klingt vielversprechend?
Bei unserem Partner Workwise ist eine Bewerbung für diesen Job in nur wenigen Minuten und ohne Anschreiben möglich. Anschließend kann der Status der Bewerbung live verfolgt werden. Wir freuen uns auf eine Bewerbung über Workwise.
Gehalts-Prognose
Bewertung von Mitarbeitenden
Gesamtbewertung
Basierend auf 314 BewertungenVorteile für Mitarbeitende
Flexible Arbeitszeiten
Home-Office
Kantine
Restaurant-Tickets
Betriebliche Altersvorsorge
Barrierefreiheit
Gesundheitsmaßnahmen
Betriebsarzt
Training
Parkplatz
Günstige Anbindung
Vorteile für Mitarbeitende
Firmenwagen
Gewinnbeteiligung
Veranstaltungen
Privat das Internet nutzen
Hunde willkommen