Ähnliche Jobs

Master s Thesis - Enhance Performance of Neural-Network-Based Action Masking

Master s Thesis - Enhance Performance of Neural-Network-Based Action Masking

Master s Thesis - Enhance Performance of Neural-Network-Based Action Masking

Master s Thesis - Enhance Performance of Neural-Network-Based Action Masking

Technische Universität München

Fach- und Hochschulen

München

  • Art der Anstellung: Vollzeit
  • Vor Ort

Master s Thesis - Enhance Performance of Neural-Network-Based Action Masking

Über diesen Job

Zurück zu Nachrichten-Bereich

Master's Thesis - Enhance Performance of Neural-Network-Based Action Masking

17.08.2025, Studentische Hilfskräfte, Praktikantenstellen, Studienarbeiten

Provably safe reinforcement learning is critical for real-world safety-critical applications. One of the core challenges is to ensure that the agent does not take unsafe actions during both training and deployment. Action masking is a common technique to prevent the agent from selecting unsafe actions. Current methods often rely on hand-crafted rules or heuristics to define and compute safe actions, which can be conservative and difficult to scale. Neural networks have shown promise in learning to mask unsafe actions directly from data and then be used for training safe reinforcement learning agents. However, the performance of neural-network-based action masking is limited especially in complex and dynamic environments.

In this thesis, we aim to enhance the performance of neural-network-based action masking for reinforcement learning. The goal is to improve and extend the existing pipeline for neural-network-based action masking, implement and test curriculum learning techniques, and finally evaluate the performance of the enhanced action masking network in an autonomous driving scenario based on CommonRoad and CommonRoad-RL.

This thesis offers an opportunity to engage in practical applications of autonomous driving. The project also aims for a publication in a peer-reviewed conference or journal.

Your tasks:
- Familiarize with our current action masking techniques.
- Familiarize with the existing code base for neural-network-based action masking in CommonRoad-RL.
- Enhance the efficiency and performance of the existing action masking pipeline.
- Implement curriculum learning techniques to improve the performance of the action masking method.
- Evaluate the performance in an autonomous driving scenario.
- Documentation of your results.

Required skills:
- Knowledge of Reinforcement Learning and Curriculum Learning.
- Good Python programming skills and experience with PyTorch.

Please find the attached PDF for a detailed topic description.

If you are interested in this topic, please send an email to shuaiyi.li@tum.de with your CV and transcript with title "[Bachelor/Master Thesis Application] ..." :D

Kontakt: shuaiyi.li@tum.de

ThesisProposal, (Type: application/pdf, Größe: 40.1 kB) Datei speichern

Unternehmens-Details

company logo

Technische Universität München

Fach- und Hochschulen

5.001-10.000 Mitarbeitende

München, Deutschland

Bewertung von Mitarbeitenden

Vorteile für Mitarbeitende

Flexible Arbeitszeiten
Home-Office
Kantine
Restaurant-Tickets
Kinderbetreuung
Betriebliche Altersvorsorge
Barrierefreiheit
Gesundheitsmaßnahmen
Betriebsarzt
Training
Parkplatz
Günstige Anbindung
Vorteile für Mitarbeitende
Smartphone
Gewinnbeteiligung
Veranstaltungen
Privat das Internet nutzen
Hunde willkommen

Unternehmenskultur

Unternehmenskultur

314 Mitarbeitende haben abgestimmt: Sie bewerten die Unternehmenskultur bei Technische Universität München als ausgeglichen zwischen traditionell und modern.Der Branchen-Durchschnitt geht übrigens in Richtung modern

Mehr Infos anzeigen

Wir benachrichtigen Dich gern über ähnliche Jobs in München:

Ähnliche Jobs

PhD Thesis: Self-Evolution for Autonomous Industrial Software

Siemens AG

Garching bei München

PhD Thesis: Self-Evolution for Autonomous Industrial Software

Garching bei München

Siemens AG

PhD Thesis: Towards Zero Maintenance Software

Siemens AG

Garching bei München

PhD Thesis: Towards Zero Maintenance Software

Garching bei München

Siemens AG

Externes Job-Angebot. Partner-Angebot

Werkstudent (m/w/d) Software Entwickler für Laser Scanner Kalibrierung mit einem Roboterarm

wenglor sensoric gmbH

Unterschleißheim

Externes Job-Angebot. Partner-Angebot

Werkstudent (m/w/d) Software Entwickler für Laser Scanner Kalibrierung mit einem Roboterarm

Unterschleißheim

wenglor sensoric gmbH

Mandatory Internship - Large Language Model Interpretability

Siemens AG

München

Mandatory Internship - Large Language Model Interpretability

München

Siemens AG

Wissenschaftlicher Mitarbeiter und Doktorand (f/m/d) im Bereich Windkraftprognose mit Hilfe von Machine Learning

Technische Universität München

München

50.000 €60.500 €

Wissenschaftlicher Mitarbeiter und Doktorand (f/m/d) im Bereich Windkraftprognose mit Hilfe von Machine Learning

München

Technische Universität München

50.000 €60.500 €

Several Thesis and Internship Openings on Cobots and Flexible Robots

Technische Universität München

München

Several Thesis and Internship Openings on Cobots and Flexible Robots

München

Technische Universität München

Professor Full time jobs in Germany

Christian-Albrechts-Universität zu Kiel

München

Professor Full time jobs in Germany

München

Christian-Albrechts-Universität zu Kiel

Internship - AIML Software Development Engineer

Apple Inc

München

Internship - AIML Software Development Engineer

München

Apple Inc

Masterarbeit / Semesterarbeit / IDP (m/w/d): Statistical Methods and Machine Learning in Medical Engineering – Foot Landmark and Bone Registration Estimation

Technische Universität München

München

Masterarbeit / Semesterarbeit / IDP (m/w/d): Statistical Methods and Machine Learning in Medical Engineering – Foot Landmark and Bone Registration Estimation

München

Technische Universität München