Cloud & Reliability Engineer (m/w/d) - Fokus Machine Learning & Generative AI
Cloud & Reliability Engineer (m/w/d) - Fokus Machine Learning & Generative AI
Cloud & Reliability Engineer (m/w/d) - Fokus Machine Learning & Generative AI
Cloud & Reliability Engineer (m/w/d) - Fokus Machine Learning & Generative AI
BARMER
Versicherungen
Gmund am Tegernsee
- Art der Anstellung: Vollzeit
- 70.500 € – 95.500 € (von XING geschätzt)
- Vor Ort
Cloud & Reliability Engineer (m/w/d) - Fokus Machine Learning & Generative AI
Über diesen Job
Cloud & Reliability Engineer (m/w/d) - Fokus Machine Learning & Generative AI
- Job-ID Job-ID
J000003846 - Einsatzort Einsatzort Bundesweit, Wuppertal, Schwäbisch Gmünd, Berlin
- Bereich Bereich
Innovation/ BARMER.KI - Besetzungstermin Besetzungstermin
01.01.2026 - Einstellungsart Einstellungsart Unbefristet
- Arbeitszeit Arbeitszeit Vollzeit, 38 Stunden wöchentlich
Teilzeit möglich - Ihr persönlicher Kontakt Ihr persönlicher Kontakt
Tabea Feikert
0800 333004 99-8138
Über uns
Wir sind über 15.000 Kolleginnen und Kollegen. Jeder von uns hat seinen individuellen Grund, bei der BARMER zu arbeiten – und jeder Grund ist uns wichtig. Aber eines haben wir alle gemeinsam: Wer hier arbeitet, setzt sich täglich für die Gesundheit von Millionen von Menschen ein: Weil wir helfen, gesünder zu leben, bei Krankheit die bestmögliche Versorgung sicherstellen und bei Vorsorge unterstützen.
In der verantwortungsvollen Position des Cloud & Reliability Engineers - Fokus Machine Learning & Generative AI tragen Sie dazu bei, dass moderne ML- und GenAI-Anwendungen sicher, stabil und skalierbar betrieben werden. Dabei gestalten Sie aktiv die technische Infrastruktur, etablieren MLOps-Praktiken für reproduzierbare Workflows und sichern den zuverlässigen Betrieb produktiver Systeme.
Im Umfeld Generative AI übernehmen Sie eine Schlüsselrolle beim Aufbau und Betrieb von RAG-Pipelines, Vektordatenbanken und LLM-Inference-Services. Darüber hinaus behalten Sie Qualität, Latenzen und Kosten stets im Blick und stellen damit die Stabilität, Effizienz und kontinuierliche Weiterentwicklung des gesamten ML-Lebenszyklus sicher.
Die ausgeschriebene Position kann wahlweise an einem unserer zentralen BARMER-Standorte ausgeübt werden: Berlin, Schwäbisch Gmünd, Wuppertal und noch ca. 30 weitere Standorte in Deutschland.
Ihre Aufgaben
- Sie bauen Cloud-Infrastrukturen für Machine-Learning- und Generative-AI-Workloads mithilfe von Infrastructure-as-Code-Tools auf und betreiben diese zuverlässig.
- CI/CD-Pipelines für Modelle, Datenpipelines und Anwendungen werden von Ihnen entwickelt und gepflegt, um wiederholbare und stabile Deployments zu ermöglichen.
- MLOps-Praktiken wie Modellversionierung, Deployment-Strategien und Lifecycle-Management setzen Sie um und entwickeln sie kontinuierlich weiter.
- RAG-Pipelines, Vektordatenbanken und LLM-Inference-Services werden von Ihnen in Produktionsumgebungen betrieben, überwacht und skaliert.
- Sie implementieren umfassendes Monitoring für Kosten, Latenzen, Verfügbarkeit und Ressourcenauslastung mit Tools wie CloudWatch, Prometheus oder OpenTelemetry.
- Reliability-Standards wie Resilience-Testing, Incident Response und Security Hardening etablieren und pflegen Sie nachhaltig.
Ihr Profil
- Sie verfügen über ein abgeschlossenes Studium (BSc, MSc oder PhD) in Informatik, Data Science, Mathematik oder über eine vergleichbare Qualifikation mit relevanter Berufserfahrung.
- Ein fundiertes Verständnis zentraler AWS-Services für Machine Learning, Generative AI und Infrastruktur (z. B. SageMaker, Bedrock, Lambda, Batch, Step Functions, ECS/EKS) zeichnet Sie aus.
- Infrastructure-as-Code-Ansätze (z. B. Terraform, AWS CDK, Pulumi oder CloudFormation) wenden Sie sicher an und automatisieren damit Cloud-Deployments.
- In der Containerisierung und Orchestrierung mit Docker, Kubernetes/EKS und Helm bringen Sie solide Erfahrung mit.
- Sie besitzen praktische Kenntnisse im Aufbau und Betrieb von CI/CD-Pipelines sowie in der Umsetzung moderner MLOps-Praktiken inklusive Modellversionierung, Drift-Detection und Lifecycle-Management.
- Mit Observability- und Monitoring-Tools wie Prometheus, Grafana, OpenTelemetry, ELK oder CloudWatch sind Sie bestens vertraut und stellen damit Stabilität und Effizienz produktiver Systeme sicher.
- Sehr gute Programmierkenntnisse in Bash sowie ein gutes Verständnis von Reliability-, Security- und Cloud-Praktiken runden Ihr fachliches Profil ab.
- Sie haben sehr gute Deutschkenntnisse auf mindestens C1-Niveau
Gehalts-Prognose
Bewertung von Mitarbeitenden
Gesamtbewertung
Basierend auf 1.578 BewertungenVorteile für Mitarbeitende
Unternehmenskultur
Unternehmenskultur
1578 Mitarbeitende haben abgestimmt: Sie bewerten die Unternehmenskultur bei BARMER als modern. Dies stimmt ungefähr mit dem Branchen-Durchschnitt überein.
