Ähnliche Jobs

AI Systems Engineer (m/w/d) - LLM Execution & Infra Optimization

AI Systems Engineer (m/w/d) - LLM Execution & Infra Optimization

AI Systems Engineer (m/w/d) - LLM Execution & Infra Optimization

AI Systems Engineer (m/w/d) - LLM Execution & Infra Optimization

Deutsches Krebsforschungszentrum

Forschung

Heidelberg

  • Art der Anstellung: Vollzeit
  • 45.500 € – 62.000 € (von XING geschätzt)
  • Hybrid

AI Systems Engineer (m/w/d) - LLM Execution & Infra Optimization

Über diesen Job

AI Systems Engineer (m/w/d) - LLM Execution & Infra Optimization

Kennziffer: 2025-0262

  • Heidelberg
  • Vollzeit
  • IT Core Facility

Das DKFZ ist eines der größten Krebsforschungszentren Europas. "Forschen für ein Leben ohne Krebs" ist unsere Mission und hierfür arbeiten unsere Weltklassewissenschaftlerinnen und – wissenschaftler gemeinsam mit allen Mitarbeitenden.

Wir erforschen, wie Krebs entsteht, erfassen Krebsrisikofaktoren und suchen nach neuen Strategien, die verhindern, dass Menschen an Krebs erkranken. Wir entwickeln neue Methoden, mit denen Tumore präziser diagnostiziert und Krebspatient:innen erfolgreicher behandelt werden können. Jeder Beitrag zählt – ob in der Forschung, in der Administration oder der Infrastruktur. Das macht unsere tägliche Arbeit so bedeutungsvoll und spannend.

Sie möchten Verantwortung übernehmen, moderne Technologien einführen und bestehende Systeme fit für die Zukunft machen? Dann sind Sie bei uns genau richtig. Wir suchen für unsere Core Facility Informationstechnologie (ITCF) zum nächstmöglichen Zeitpunkt einen

Ihre Aufgaben:

Sie verantworten die technische Infrastruktur für die Bereitstellung von Large Language Models (LLMs) auf unserer High-End-GPU-Hardware. Ihre Arbeit gewährleistet hochperformante und skalierbare Lösungen für alle Anwender:innen generativer KI am DKFZ.

  • Infrastruktur-Architektur & Skalierung: Konzeption, Implementierung und Skalierung der LLM-Infrastruktur (Hardware, Container, Orchestrierung)
  • Inferenz-Optimierung: Maximierung der Ressourcenauslastung durch geeignete Techniken wie KV-Caching, Quantisierung und Parallelisierung
  • Hardware-Integration: Betrieb und Optimierung von LLMs auf NVIDIA-GPU-Plattformen (CUDA), inklusive hardwarenahen Anpassungen
  • API-Integration & Management: Design und Betrieb von RESTful APIs und API Gateways (z. B. Kong, KrakenD) für sichere, skalierbare LLM-Schnittstellen
  • LLM-Modellauswahl: Evaluation und selektive Bereitstellung von LLMs nach Anforderungen (z. B. Logik/Sprachverständnis, Code-Generierung)
  • RAG-Optimierung: Integration von Embedding- und Reranking-Modellen zur Verbesserung der Suchqualität in RAG-Pipelines
  • Anwendungs-Integration: Nahtlose Integration in Frontends (Open WebUI) und Datenpipelines mit KI-Entwicklern
  • Automatisierung & Monitoring: Sicherstellung eines stabilen Betriebs durch automatisiertes Konfigurationsmanagement (Ansible) und umfassendes Monitoring (Prometheus/Grafana)
  • Kooperation in der Helmholtz-Gemeinschaft Deutscher Forschungszentren: Beitrag zur Standardisierung von LLM-Infrastrukturen im Rahmen der Helmholtz-KI-Initiativ
  • Ansprechpartner:in für KI-Demands am DKFZ und Mitarbeit im KI-Kompetenzteam des DKFZ

Sie arbeiten an spannenden Projekten mit modernen Technologien in einem Umfeld, in dem Ihre Ideen zählen und Sie Verantwortung übernehmen können. Durch Ihren Beitrag unterstützen Sie unsere Mission "Forschen für ein Leben ohne Krebs" und gestalten die Zukunft unserer IT-Landschaft mit!

Ihr Profil:

  • Abgeschlossenes Masterstudium der Informatik oder eines verwandten Fachs
  • Praktische Erfahrung mit:
    • LLM-Inferenz-Engines (vLLM, Ollama)
    • Optimierungstechniken (Quantisierung, KV-Caching, Parallelisierung)
    • Aktuellen LLM-Technologien (z. B. Mixture of Experts, Reasoning) sowie Retrieval Augmented Generation (RAG) und MCP (Model Context Protocol)
  • Fundierte Kenntnisse in:
    • Linux-Systemadministration
    • Cloud- und Container-Technologien (OpenStack, Kubernetes, Docker/Podman)
    • Teamgeist, Kommunikationsstärke (Deutsch & Englisch) sowie eine proaktive, lösungsorientierte Arbeitsweise
    • Ausgeprägte Ausdrucksfähigkeit in Deutsch und Englisch, sowohl mündlich als auch schriftlich (mind. B2)

Ihr Profil wird idealerweise abgerundet durch Erfahrung in DevOps-Prozessen, beispielsweise GitLab und CI/CD-Pipelines, automatisiertem Konfigurationsmanagement (Ansible) und Kenntnisse in der Python-Entwicklung.

Unser Angebot:

Hervorragende Rahmenbedingungen: modernste state-of-the-art Infrastruktur und Möglichkeit zum internationalen Austausch auf Spitzenniveau

30 Tage Urlaub

Flexible Arbeitszeiten

Vergütung nach TV-L inkl. betrieblicher Altersvorsorge und vermögenswirksamer Leistungen

Möglichkeit zur mobilen Arbeit und Teilzeitarbeit

Familienfreundliches Arbeitsumfeld

Nachhaltig zur Arbeit: Vergünstigtes Deutschland-Jobticket

Entfalten Sie Ihr volles Potenzial: gezielte Angebote für Ihre persönliche Entwicklung fördern Ihre Talente

Unser betriebliches Gesundheitsmanagement bietet ein ganzheitliches Angebot für Ihr Wohlbefinden

Sie sind interessiert?

Dann werden auch Sie Teil des DKFZ und tragen gemeinsam mit uns zu einem Leben ohne Krebs bei!
Befristung: Die Stelle ist unbefristet.
Bewerbungsschluss: 18.10.2025

Bewerbungen per E-Mail können leider nicht angenommen werden. ​
Bitte beachten Sie auch, dass wir per Post eingereichte Bewerbungen nicht zurückschicken können.

Wir sind davon überzeugt: Ein innovatives Forschungs- und Arbeitsumfeld lebt von der Vielfalt seiner Beschäftigten. Daher freuen wir uns über Bewerbungen von talentierten Menschen, unabhängig von Geschlecht, kulturellem Hintergrund, Nationalität, ethnischer Zugehörigkeit, sexueller Identität, körperlichen Fähigkeiten, Religion und Alter. Menschen mit Schwerbehinderung werden bei gleicher Eignung bevorzugt.
Hinweis: Wir unterliegen den Vorschriften des Infektionsschutzgesetzes (IfSG). Deshalb müssen alle unsere Beschäftigten einen Immunitätsnachweis gegen Masern vorlegen.

Gehalts-Prognose

Unternehmens-Details

company logo

Deutsches Krebsforschungszentrum

Forschung

51-200 Mitarbeitende

Berlin, Deutschland

Bewertung von Mitarbeitenden

Vorteile für Mitarbeitende

Flexible Arbeitszeiten
Home-Office
Betriebliche Altersvorsorge
Barrierefreiheit
Gesundheitsmaßnahmen
Betriebsarzt
Training
Parkplatz
Günstige Anbindung
Smartphone
Veranstaltungen
Privat das Internet nutzen
Hunde willkommen

Unternehmenskultur

Unternehmenskultur

14 Mitarbeitende haben abgestimmt: Sie bewerten die Unternehmenskultur bei Deutsches Krebsforschungszentrum als traditionell. Der Branchen-Durchschnitt geht übrigens leicht in Richtung modern

Mehr Infos anzeigen

Wir benachrichtigen Dich gern über ähnliche Jobs in Heidelberg:

Ähnliche Jobs

Cloud Engineer (f/m/d)

Universität Heidelberg

Heidelberg

55.000 €76.500 €

Cloud Engineer (f/m/d)

Heidelberg

Universität Heidelberg

55.000 €76.500 €

(Senior) Research Scientist (m/f/d) - Advanced Software Engineering for Industrial Systems (80 – 100%)

ABB

Mannheim

81.000 €109.500 €

(Senior) Research Scientist (m/f/d) - Advanced Software Engineering for Industrial Systems (80 – 100%)

Mannheim

ABB

81.000 €109.500 €

Data Processing System Engineer [25136]

Sopra Steria DE

Darmstadt

63.500 €86.000 €

Data Processing System Engineer [25136]

Darmstadt

Sopra Steria DE

63.500 €86.000 €

Senior AI / Data Science Engineer mit Erfahrung im Bereich LLM (m/w/d)

auteega Gmbh

Mannheim

62.500 €104.000 €

Senior AI / Data Science Engineer mit Erfahrung im Bereich LLM (m/w/d)

Mannheim

auteega Gmbh

62.500 €104.000 €

Softwareentwickler für Bildverarbeitung (m/w/d) - J7144

Exclusive Associates

Mannheim

56.000 €74.000 €

Softwareentwickler für Bildverarbeitung (m/w/d) - J7144

Mannheim

Exclusive Associates

56.000 €74.000 €

Research Scientist (Machine Learning) (m/f/d) - Virtual Patient Engine (VPE)

BioMed X GmbH

Heidelberg

63.000 €84.500 €

Research Scientist (Machine Learning) (m/f/d) - Virtual Patient Engine (VPE)

Heidelberg

BioMed X GmbH

63.000 €84.500 €

(Senior) Data Scientist (m/w/d) Energiemarkt in Mannheim (hybrid)

PAUL Tech AG

Mannheim

64.500 €89.000 €

(Senior) Data Scientist (m/w/d) Energiemarkt in Mannheim (hybrid)

Mannheim

PAUL Tech AG

64.500 €89.000 €

Interim Senior Developer - Crypto Structured Products (m/w/d)

Michael Page

Frankfurt am Main

Interim Senior Developer - Crypto Structured Products (m/w/d)

Frankfurt am Main

Michael Page

Data Processing Operations Engineer [25138]

Sopra Steria DE

Darmstadt

58.500 €78.500 €

Data Processing Operations Engineer [25138]

Darmstadt

Sopra Steria DE

58.500 €78.500 €