Navigation überspringen

Vor 15 Tagen

LLM Engineer / AI Platform Engineer (m/w/d)

LLM Engineer / AI Platform Engineer (m/w/d)

relyon

Internet, IT

  • Tübingen
  • Vollzeit
  • 58.000 € – 64.500 € (von XING geschätzt)
Vor OrtAktiv auf der Suche

LLM Engineer / AI Platform Engineer (m/w/d)

Über diesen Job

LLM Engineer / AI Platform Engineer (m/w/d)

Projektkontext

OneAI ist eine mandantenfähige Enterprise-KI-Plattform mit lokal betriebenen Sprachmodellen (LLMs), Retrieval-Augmented Generation (RAG), automatisierten Datenimporten und Agentensteuerung.

Als LLM Engineer bist Du für die technische Basis unserer KI-Funktionen verantwortlich:
Du orchestrierst die Modellbereitstellung (Ollama), Embedding-Logik (LangChain, pgvector) und entwickelst das semantische Rückgrat unseres Systems – mandantenfähig, performant und EU-konform.

Deine Aufgaben

  • Integration, Management und Optimierung lokaler LLMs (Ollama, LLaMA, Mistral, DeepSeek)
  • Aufbau und Pflege der Embedding-Pipeline (Text-Chunks, pgvector, LangChain)
  • Entwicklung & Betreuung von RAG-Komponenten , Retrieval-Strategien, Scoring
  • Unterstützung bei LARA-Logik (Layered AI Retrieval Architecture) und promptbasierter Steuerung
  • Modell-Management & Multi-Modell-Verwaltung (per API, CLI oder REST)
  • Zusammenarbeit mit Backend (API), DevOps (Deployment), PO (Use Cases)
  • Performance-Tuning, GPU-Auslastungsanalyse (MIG), Troubleshooting1

Unser Stack

  • LLM-Infra: Ollama, Mistral, LLaMA, DeepSeek, GPU via MIG
  • Embedding: LangChain, pgvector, Chunking, TextSplitter, FAISS (optional)
  • Backend/API: Bun, TypeScript, REST, WebSocket
  • Storage: PostgreSQL, SeaweedFS, JSON-Vektoren
  • Orchestrierung: Docker, Traefik, 0codeDeploy, Prometheus, Grafana

Dein Profil

  • Erfahrung mit LLM-Infrastruktur (Ollama, LangChain, gguf, HuggingFace, vllm o. ? ä.)
  • Sehr gutes Verständnis von Embedding-Konzepten, RAG, Vektorraumlogik, Prompt Engineering
  • Praktische Erfahrung mit pgvector , SQL, Text-Splitting & Preprocessing
  • Kenntnisse in TypeScript, Python oder Shell (z.?B. zur Integration in Pipelines)
  • Interesse an GPU-Strategien, Modellgrößen, Quantisierung, Inferenzoptimierung
  • Sorgfältige, dokumentierende, API-orientierte Arbeitsweise

Bonuspunkte

  • Erfahrung mit Feintuning / LoRA / ggml-Optimierung
  • Kenntnisse in Modellvergleich, Score-Tuning, Custom Prompt Templates
  • Praxis in Mandantenfähiger RAG oder RAG-as-a-Service
  • Grundlagen in LLM-Sicherheit (Injection Detection, Moderation)

Wenn Du RAG-Architekturen spannend findest, mit Embeddings experimentierst und AI nicht nur nutzen, sondern mitentwickeln willst – bist Du hier richtig.
Bewirb Dich und baue mit uns die souveränste KI-Plattform Europas.

Tätigkeitsbereich
Karrierestufe
Arbeitszeit
Standorte

Ähnliche Jobs

KI Software Architekt:in / Entwickler:in (m/w/d)

Ulm

eXXcellent solutions

63.500 €85.000 €

Gestern

Expert MLOps Engineer (m/f/d)

Metzingen

HUGO BOSS AG

63.500 €77.500 €

Vor 30+ Tagen

AI Engineer / AiOps (m/w/d)

Überlingen

Diehl Defence

68.500 €85.500 €

Vor 22 Tagen

Senior Python Entwickler | Cloud; Django, Flask, FastAPI; KI, LLM | bis 60% Home Office (mwd)

Ulm

Vesterling AG

55.000 €75.000 €

Vor 5 Tagen

Gehalts-Prognose

Unternehmens-Details

company logo

relyon

Internet, IT

11-50 Mitarbeitende

Tübingen, Deutschland

Bewertung von Mitarbeitenden

Vorteile für Mitarbeitende

Flexible Arbeitszeiten
Home-Office
Restaurant-Tickets
Betriebliche Altersvorsorge
Barrierefreiheit
Gesundheitsmaßnahmen
Training
Parkplatz
Günstige Anbindung
Vorteile für Mitarbeitende
Firmenwagen
Smartphone
Gewinnbeteiligung
Veranstaltungen
Privat das Internet nutzen
Hunde willkommen

Unternehmenskultur

Unternehmenskultur

35 Mitarbeitende haben abgestimmt: Sie bewerten die Unternehmenskultur bei relyon als sehr modern.Der Branchen-Durchschnitt geht übrigens in Richtung modern

Mehr Infos anzeigen

Wir benachrichtigen Dich gern über ähnliche Jobs in Tübingen:

Ähnliche Jobs

KI Software Architekt:in / Entwickler:in (m/w/d)

Ulm

eXXcellent solutions

63.500 €85.000 €

Gestern

Expert MLOps Engineer (m/f/d)

Metzingen

HUGO BOSS AG

63.500 €77.500 €

Vor 30+ Tagen

AI Engineer / AiOps (m/w/d)

Überlingen

Diehl Defence

68.500 €85.500 €

Vor 22 Tagen

Senior Python Entwickler | Cloud; Django, Flask, FastAPI; KI, LLM | bis 60% Home Office (mwd)

Ulm

Vesterling AG

55.000 €75.000 €

Vor 5 Tagen

Senior Python Entwickler | Cloud; Django, Flask, FastAPI; KI, LLM | bis 60% Home Office (mwd)

Sandhausen

Vesterling AG

55.000 €75.000 €

Vor 5 Tagen

Cloud Engineer (m/w/d) - Tübingen - ALPHA-ENGINEERING KG

Tübingen

Alpha-Engineering GmbH & Co. KG

58.000 €74.500 €

Gestern

Senior Python Entwickler | Cloud; Django, Flask, FastAPI; KI, LLM | bis 60% Home Office (mwd)

Karlsruhe

Vesterling AG

55.000 €75.000 €

Vor 5 Tagen

Senior Python Entwickler | Cloud; Django, Flask, FastAPI; KI, LLM | bis 60% Home Office (mwd)

Stuttgart

Vesterling AG

55.000 €75.000 €

Vor 5 Tagen

AI Software Engineer - Java / Python / Angular (m/w/d)

Karlsruhe

SquareNeo

63.000 €83.500 €

Vor 3 Tagen

Python Entwickler / Backend Developer / Softwareentwickler (m/w/d) bis zu 9.600€ brutto

Stuttgart

Tech Staff Solutions Heidelberg GmbH

39.000 €115.000 €

Vor 19 Tagen

Python Entwickler / Backend Developer / Softwareentwickler (m/w/d) bis zu 9.600€ brutto

Karlsruhe

Tech Staff Solutions Heidelberg GmbH

39.000 €115.000 €

Vor 19 Tagen

Python Entwickler / Backend Developer / Softwareentwickler (m/w/d) bis zu 9.600€ brutto

Heilbronn

Tech Staff Solutions Heidelberg GmbH

39.000 €115.000 €

Vor 19 Tagen

Python Entwickler / Backend Developer / Softwareentwickler (m/w/d) bis zu 9.600€ brutto

Ulm

Tech Staff Solutions Heidelberg GmbH

39.000 €115.000 €

Vor 19 Tagen