Ähnliche Jobs

Abschlussarbeit (w/m/d): Extraktion von Text-Objekt-Relations in technischen Zeichnungen mit LLMs

Abschlussarbeit (w/m/d): Extraktion von Text-Objekt-Relations in technischen Zeichnungen mit LLMs

Abschlussarbeit (w/m/d): Extraktion von Text-Objekt-Relations in technischen Zeichnungen mit LLMs

Abschlussarbeit (w/m/d): Extraktion von Text-Objekt-Relations in technischen Zeichnungen mit LLMs

Deutsches Zentrum für Luft- und Raumfahrt e.V. (DLR)

Forschung

St. Augustin

  • Art der Beschäftigung: Studierende
  • Vor Ort
  • Zu den Ersten gehören

Abschlussarbeit (w/m/d): Extraktion von Text-Objekt-Relations in technischen Zeichnungen mit LLMs

Über diesen Job

Das Institut für den Schutz terrestrischer Infrastrukturen hat die stabile Versorgung der Gesellschaft zum Ziel. Digitale Zwillinge ermöglichen die Überwachung und Reaktion auf Krisen und Angriffe sowie die Analyse und Optimierung der Resilienz terrestrischer Infrastrukturen.

 

Das erwartet dich 

Eine Herausforderung bei der Erstellung digitaler Zwillinge ist die Umwandlung von technischen Dokumentationen, insbesondere von Rohrleitungs- und Instrumentierungsdiagrammen (P&IDs) und elektrischen Schaltplänen, in strukturierte, maschinenlesbare Daten. In dieser Arbeit sollen Methoden erforscht und evaluiert werden, die Textannotationen (Beschriftungen, Notizen, Teilenummern) nutzen, indem Sie Large Language Model (LLM)-Features mit Objektdetektoren kombinieren, die zur Vorhersage von Graphen verwendet werden.

 

Deine Aufgaben

  • Implementierung moderner OCR-Technologie für P&IDs und elektrische Zeichnungen und Aufbau eines Datensatzes (synthetisch + real) für Training und Evaluierung
  • Erstellung eines Tools zum Taggen von Textstrings und den zugehörigen Symbolen, um Ground-Truth-Beziehungstabellen (Text ↔ Objekt) zu erstellen
  • Vergleich und Bewertung verschiedener Ansätze zur Kombination der Textfeatures mit der Symbolerkennung:
    • regelbasierte Methoden, die Distanz, Ausrichtung und domänenspezifische Hinweise verwenden (z. B. „Text, der über einem Symbol platziert ist, beschreibt dieses in der Regel“)
    • Extraktion von semantischen Features aus dem erkannten Text mit einem vortrainierten LLM und Kombinierung mit CNN-Features der Symbole
    • Training eines Classifiers, der Text- und Objekt-features als Eingabe nimmt und eine binäre Ausgabe „related/nicht related“ vorhersagt
    • Erfassung, wissenschaftliche Analyse und Präsentation der Untersuchungsergebnisse

 

Das bringst du mit

  • laufendes Studium in Informatik, Mechatronik, Elektrotechnik oder einem verwandten Fachgebiet
  • Bereitschaft, sich in komplexe Themen einzuarbeiten
  • Grundkenntnisse im Bereich Machine Learning
  • gute Kenntnisse in der Programmierung mit Python
  • selbstständiges Arbeiten
  • gute Kommunikations- und Teamfähigkeiten

Gewünschte Qualifikation:

  • Erfahrung mit Computer Vision-Bibliotheken wie OpenCV, PyTorch oder TensorFlow
  • Grundkenntnisse von LLMs

Wir freuen uns darauf, dich kennenzulernen!

Fragen zu dieser Position (Kennziffer 4254) beantwortet dir gerne:

Tobias Koch 
Tel.: +49 2241 20148 55 

Unternehmens-Details

company logo

Deutsches Zentrum für Luft- und Raumfahrt e.V. (DLR)

Forschung

5.001-10.000 Mitarbeitende

Köln, Deutschland

Ähnliche Jobs

CZS Endowed Professorship (f/m/d)

Hochschule Koblenz

Remagen + 0 weitere

51.000 €69.500 €

CZS Endowed Professorship (f/m/d)

Remagen + 0 weitere

Hochschule Koblenz

51.000 €69.500 €

Werkstudent AI Engineer (m/w/d)

TRILUX Deutschland

Köln + 0 weitere

Werkstudent AI Engineer (m/w/d)

Köln + 0 weitere

TRILUX Deutschland

Werkstudent (m/w/d) – Workflow Automation & Agentic AI

Anstalt für Kommunale Datenverarbeitung in Bayern (AKDB)

Köln + 0 weitere

Werkstudent (m/w/d) – Workflow Automation & Agentic AI

Köln + 0 weitere

Anstalt für Kommunale Datenverarbeitung in Bayern (AKDB)

Werkstudent / Praktikant (m/w/d) Softwareentwicklung E-System & Hochvoltbatterien

DEUTZ AG

Köln + 0 weitere

Werkstudent / Praktikant (m/w/d) Softwareentwicklung E-System & Hochvoltbatterien

Köln + 0 weitere

DEUTZ AG

Abschlussarbeit: Datenplausibilisierung und Modellierung im Niederspan

amperias GmbH

Frechen + 0 weitere

Abschlussarbeit: Datenplausibilisierung und Modellierung im Niederspan

Frechen + 0 weitere

amperias GmbH

Masterarbeit (w/m/d): Techno-ökonomischer Vergleich von Parabolrinnenkollektoren

Deutsches Zentrum für Luft- und Raumfahrt e.V. (DLR)

Köln + 0 weitere

Masterarbeit (w/m/d): Techno-ökonomischer Vergleich von Parabolrinnenkollektoren

Köln + 0 weitere

Deutsches Zentrum für Luft- und Raumfahrt e.V. (DLR)

CZS-Stiftungsprofessur (w/m/d)

Hochschule Koblenz

Remagen + 0 weitere

48.000 €64.000 €

Neu · 

CZS-Stiftungsprofessur (w/m/d)

Remagen + 0 weitere

Hochschule Koblenz

48.000 €64.000 €

Neu · 

CZS-Stiftungsprofessur für Künstliche Intelligenz mit Schwerpunkt Autonome Systeme

Hochschule Koblenz

Remagen + 0 weitere

51.500 €71.000 €

CZS-Stiftungsprofessur für Künstliche Intelligenz mit Schwerpunkt Autonome Systeme

Remagen + 0 weitere

Hochschule Koblenz

51.500 €71.000 €

Praktikanten (m/w/d) – Machine Learning

HEAD acoustics GmbH

Herzogenrath + 0 weitere

Praktikanten (m/w/d) – Machine Learning

Herzogenrath + 0 weitere

HEAD acoustics GmbH