SynthBAD – Synthetische Batchdatenerzeugung für aktives Lernen und Domänenadaption

Um die kostspielige Erhebung von Realdaten zu vermeiden, entwickelt das Projekt eine innovative Werkzeugkette zur synthetischen Erzeugung realistischer Kameradaten. Diese Daten unterstützen das KI-Training im automatisierten Straßenverkehr und in der Robotik, getestet auf den Institutsanlagen ViewCar II und FASCar.

Die Erhebung umfangreicher Realdaten spielt eine wesentliche Rolle bei der Entwicklung von KI-Systemen und ist oft mit einem hohen zeitlichen und finanziellen und damit nicht mehr ökonomisch vertretbarem Aufwand verbunden. Aus diesem Grund besteht der dringende Bedarf die für das Training einer KI erforderlichen Daten synthetisch zu erzeugen. Dabei bestehen allerdings noch diverse Herausforderungen, wie z.B. die Unausgeglichenheit und Redundanz der Trainingsdaten. So darf beispielsweise das seltene Auftreten bestimmter kritischer Ereignisse (z.B. Beinaheunfall) nicht zu falschem Systemverhalten führen. Eine zur Datengenerierung häufig benutzte Technik ist dabei die Domänenanpassung, mit der bestehende Daten einer Quelldomäne (z.B. Weg- und Hinderniserkennung) auf eine bestimmte Zieldomäne (z.B. Weg- und Hinderniserkennung bei schlechtem Wetter) adaptiert werden ohne diese Daten erneut annotieren zu müssen. Daher besteht das Ziel des Projektes darin eine Werkzeugkette zu entwickeln, mit der realistische Kameradaten für Anwendungen im automatisierten Straßenverkehr und in der Robotik synthetisch erzeugt werden sowie diese anzuwenden und zu demonstrieren.

Überführung synthetischer Daten (links) in für die KI benötigte, domänenadaptierte Daten (rechts).
Credit:

links ©Rockstar Games (aus GTA) (Playing for Data: Ground Truth from Computer Games (tu-darmstadt.de)), rechts ©DLR

Das Projekt liefert einen Forschungsbeitrag zum automatisierten Fahren, indem die Werkzeugkette auf die Sensorik der Institutsanlagen ViewCar II und FASCar nachgebildet und so synthetische Daten für das KI-Training mit unseren Fahrzeugen erzeugt werden. Das DLR-Institut für Verkehrssystemtechnik definiert die Anforderungen an eine solche Werkzeugkette, konzeptioniert, implementiert und testet sie.

Initiale Prozesskette

Projektname:
SynthBAD - Synthetische Batchdatenerzeugung für aktives Lernen und Domänenadaption

Laufzeit:
01/2023 bis 12/2023

Projektvolumen:
165.902,26 €

Dieses Projekt wird geleitet von der Abteilung:

Kontakt

Dr. Sascha Knake-Langhorst

Abteilungsleiter
Deutsches Zentrum für Luft- und Raumfahrt (DLR)
Institut für Verkehrssystemtechnik
Informationsgewinnung und Modellierung
Lilienthalplatz 7, 38108 Braunschweig