Datengewinnung und -mobilisierung

Die Forschungs- und Entwicklungsarbeiten der Abteilung zielen auf die Bereitstellung hochwertiger Daten für Industrie und Wissenschaft ab. Diese stellen die Grundlage für die Erreichung nachhaltiger interdisziplinärer Wertschöpfungsketten sowie zur datengetriebenen Entscheidungsunterstützung in komplexen Systemen dar. Dabei gilt es, die wesentlichen Herausforderungen Nutzbarkeit, Verfügbarkeit und Zugang zu meistern.

Aus diesen Herausforderungen leiten sich die Schwerpunkte der Abteilung ab:

  • Die Entwicklung effektiver Methoden zur Sicherung von Datenqualität bei der Datengewinnung sowie von Zuverlässigkeit und Repräsentativität  aus Daten abgeleiteter Informationen
  • Die Nutzbarmachung bisher unerschlossener Datenquellen mittels Entwicklung neuartiger Methoden zur Datenerhebung und der Incentivierung von Data-Sharing
  • Das Schaffen effektiver und zielgruppenorientierter Datenzugänge
  • Die Gewährleistung sicherer und vertrauenswürdiger Datenlieferketten.

Übergreifend widmet sich die Abteilung der Berücksichtigung des Faktors Mensch bei der Entwicklung datenwissenschaftlicher Methoden sowie der Entwicklung effektiver Konzepte für Wissens- und Technologietransfer als elementare Grundlagen für die Wirksamkeit und Akzeptanz datenbasierter Anwendungen.

Die Abteilung setzt sich aus drei Gruppen zusammen:

Datenverfügbarkeit und -bereitstellung

Die Arbeitsgruppe Datenverfügbarkeit und -bereitstellung bedient die Kernherausforderung der Abteilung, nämlich die Verfügbarkeit von Daten. Zu diesem Zweck erforscht und entwickelt sie nutzerzentrierte Methoden für die Gewinnung und Bereitstellung von Daten, die dann als Basis für innovative datenbasierte Anwendungen und Dienstleistungen sowie für datengetriebene Forschung dienen. Die Forschung in der Datengewinnung beinhaltet unter anderem die Entwicklung von Methoden zur Qualitätssicherung bei der Annotation von Daten, Methoden zur Incentivierung von Data-Sharing und zum vertrauensvollen Austausch von Daten. Im Bereich der Datenbereitstellung gehört unter anderem das Schaffen effektiver und zielgruppenorientierter Datenzugänge zu den Schwerpunkten der Arbeitsgruppe.

Sichere Softwaretechnik

Daten bilden die Grundlage für datengetriebene Geschäftsmodelle und Forschung. Sie werden in diesem Zusammenhang fast ausschließlich von Software verarbeitet, ob in Form von Produkten oder Datenanalyse-Prozessketten. Die Entwicklung von zuverlässiger, robuster und sicherer Software spielt daher eine wichtige Rolle, insbesondere wenn diese Software ein Bestandteil komplexer Systeme oder kritischer nationaler Infrastrukturen ist. Ein Ausfall der Software oder eine Anfälligkeit für Cyberangriffe oder Störungen kann beispielsweise sowohl für Satelliten als auch am Boden katastrophale Folgen und Schäden nach sich ziehen. Entsprechend wichtig ist die Unterstützung der Entwickelnden bei der Realisierung sicherer, robuster und zuverlässiger Softwaresysteme und -architekturen. Die Arbeitsgruppe Sichere Softwaretechnik erforscht dazu systematisch Methoden, Werkzeuge und Prozesse der sicheren Softwareentwicklung. Sie hat das Ziel, alle Sicherheitsaspekte des Softwarelebenszyklus weitestgehend zu automatisieren.

Dieses erreicht sie unter anderem durch Beiträge zu sicherem Design wie der automatischen architekturbasierten Risikoanalyse und Threat Modeling. Die Implementierung wird z.B. durch Machine Learning-basierte Ansätze der Programmanalyse zur Schwachstellenerkennung und Klonerkennung abgesichert. Der sichere Betrieb von Software mit komplexer Entscheidungsfindung wird durch anomalieorientierte Echtzeitüberwachung gewährleistet. Ein weiterer Schwerpunkt liegt auf der Absicherung von Datenlieferketten.

Multimodales und raumbezogenes Informationsretrieval:

Ein großer Anteil der online und lokal verfügbaren Daten ist für Zwecke der Forschung, Wertschöpfung und Entscheidungsunterstützung nicht unmittelbar nutzbar. Inhalt und Ortsbezug von Textdokumente, Webseiten, Bildern und Audioaufnahmen sind meist nicht bekannt. Diese Informationen müssen mit entsprechenden Analysemethoden identifiziert und extrahiert werden. Die Gruppe erforscht daher praxisrelevante Methoden und entwickelt modulare Software zur Erhebung, Aufbereitung, Filterung, Verortung und inhaltlichen Bewertung unstrukturierter Daten. Ziel ist, bisher nicht maschinenlesbare Daten für verschiedenste Anwendungen des DLR als Informationsquelle und für die Entscheidungsunterstützung nutzbar zu machen. Dafür werden anwendungsrelevanten Daten und Informationen in großen Datenmengen robust identifiziert, bedarfsgerecht bereitgestellt, geolokalisiert sowie hinsichtlich verschiedener Aspekte, wie inhaltlicher Tiefe, Aktualität, räumlicher Genauigkeit und Verlässlichkeit bewertet.

Das Anwendungsportfolio umfasst derzeit die Bereiche zivile Sicherheit, Lagebild, Naturgefahren und Extremwetterereignisse. In diesem Kontext wird die Bereitstellung, Kombination und Fusion von ortsbezogenen Textdaten mit Geodaten und Fernerkundungsdaten erforscht. Darüber hinaus wird das Potential von bisher ungenutzten Text- und Audiodaten für Anwendungen in den Bereichen Luftfahrt, Verkehr und Energie untersucht.

Projekte der Abteilung Datengewinnung und -mobilisierung

laden

Kontakt

Dr. Friederike Klan

Abteilungsleiterin
Institut für Datenwissenschaften
Datengewinnung und -mobilisierung
Mälzerstraße 5, 07745 Jena