Student Informatik (w/m/d) - Integrating LLM into STT for output correction
Student Informatik (w/m/d) - Integrating LLM into STT for output correction
- Braunschweig
- Vollzeit
Student Informatik (w/m/d) - Integrating LLM into STT for output correction
Über diesen Job
Das DLR-Institut für Softwaretechnologie versteht Software als Katalysator für Forschung und Innovation. Als Expertinnen und Experten für Software erforschen und entwickeln wir hochmoderne Lösungen in allen Anwendungsbereichen des DLR.
Zu unseren Kompetenzfeldern zählen zuverlässige und sicherheitskritische Softwaresysteme, Künstliche Intelligenz, High-Performance Computing und Quantum Computing, Mensch-System-Interaktion und Visualisierung, Software und Systems Engineering sowie Digitale Plattformen und Digitale Zwillinge.
Die derzeit rund 200 Mitarbeitenden des Instituts tragen mit ihrer Forschung und der Entwicklung hochmoderner Softwarelösungen schon heute zu den Innovationen für Luftfahrt, Raumfahrt, Energie, Verkehr und Sicherheit von morgen bei.
Was Sie erwartet
Concurrent Engineering (CE) ermöglicht die parallele Arbeit verschiedener Disziplinen - Strukturdesign, Avionik, Software - und macht die Zusammenarbeit unerlässlich. Ingenieure müssen Kompromisse abwägen, eine reibungslose Integration sicherstellen und effektiv kommunizieren. Large Language Models (LLMs) können diesen Prozess unterstützen, indem sie Diskussionen analysieren, die Dokumentation verfeinern und bei der Entscheidungsfindung helfen. Unsere Gruppe Modellierung und Simulation entwickelt ein System, das Speech-to-Text (STT) und LLM-Technologien kombiniert, um technische Diskussionen in Concurrent Engineering Facilities (CEFs) zu erfassen und zu verarbeiten.
Ihre Aufgaben
Ihre Masterarbeit wird sich auf folgende Punkte beziehen:
1. eine Literaturübersicht - Untersuchen Sie, wie gut STT-Modelle in technischen Umgebungen funktionieren, insbesondere in der Luft- und Raumfahrt. Analysieren Sie ihren Umgang mit Fachjargon, häufigen Fehlern und Korrekturmethoden. Untersuchen Sie, wie LLMs und domänenspezifische Wörterbücher die Genauigkeit verbessern können.
2. Implementierung - Entwickeln Sie eine kleine Demonstration, um ein STT-Modell in einer simulierten technischen Diskussion zu testen. Bewerten Sie seine Leistung, identifizieren Sie Einschränkungen und integrieren Sie LLM-basierte Korrekturmechanismen zur Verbesserung der Transkriptionsqualität.
Das bringst du mit
- Beherrschung von Programmiersprachen: Erfahrung in Python ist unerlässlich
- Kenntnisse über neuronale Netze: Grundlegendes Verständnis von neuronalen Netzen und Vertrautheit mit Deep Learning Frameworks wie PyTorch, TensorFlow und Keras
- Kenntnisse der Datenmanipulation: Erfahrung mit Pandas und NumPy zur Datenanalyse und -manipulation
- Vertrautheit mit Large Language Models (LLMs): Grundlegendes Verständnis von LLM-Architekturen, Prompt-Engineering und häufige Herausforderungen bei deren Anwendung
- ausgeprägte Englisch-Kenntnisse: Gute Kommunikationsfähigkeiten, sowohl in Wort als auch in Schrift
- Eigenmotivation und Selbstständigkeit: Die Fähigkeit, unabhängig zu arbeiten, Aufgaben zu übernehmen und Probleme proaktiv zu lösen
- Belastbarkeit und Risikobereitschaft: Bereitschaft zu experimentieren, aus Fehlern zu lernen und Lösungen weiterzuentwickeln
Wir freuen uns darauf, dich kennenzulernen!
Fragen zu dieser Position (Kennziffer 717) beantwortet dir gerne:
Andreas Gerndt
Tel.: +49 531 295 2782
Unternehmensdetails
Bewertung von Mitarbeitenden
Gesamtbewertung
Basierend auf 737 BewertungenVorteile für Mitarbeitende
Unternehmenskultur
Deutsches Zentrum für Luft- und Raumfahrt e.V. (DLR)
Branchen-Durchschnitt
Unternehmenskultur
737 Mitarbeitende haben abgestimmt: Sie bewerten die Unternehmenskultur bei Deutsches Zentrum für Luft- und Raumfahrt e.V. (DLR) als modern. Dies stimmt in etwa mit dem Branchen-Durchschnitt überein.