Standardisierung eines erweiterbaren Modells für Provenance-Daten



Projektbeschreibung

Die Validierung von Ergebnissen aus Geschäftsprozessen, Simulationen oder Experimenten ist in vielen Geschäfts- und Forschungsgebieten wichtig. Beispiele sind akademische „Reviews“ von Daten oder Veröffentlichungen, Audits finanzieller Transaktionen oder Überprüfung und Auditierung medizinischer Vorgänge.

Allgemein ist es bei Prozessen zur Erzeugung oder Verarbeitung von Daten oft wünschenswert, die Entstehung der Resultate nachvollziehen zu können. Das hat ganz praktische Vorteile. Man kann die Entstehung der Daten reproduzieren und ggf. die Daten erneut erzeugen. Oder man kann die Konformität des datenerzeugenden Prozesses entsprechend bestimmter geltender Regularien überprüfen. Schließlich ist es auch möglich, Beweissicherheit bzgl. Verwendung und Überprüfung der Daten zu erreichen.

 Grundkonzepte des W3C Provenance Data Model (PROV-DM)
zum Bild Grundkonzepte des W3C Provenance Data Model (PROV-DM)

Die Aufzeichnung detaillierter Informationen über die Entstehung und den Ursprung von Daten wird als Provenance bezeichnet. Basierend auf einem Modell des aufzuzeichnenden Prozesses („Provenance-Modell“) werden dabei alle relevanten Informationen des Prozesses in einer Datenbank gespeichert. Diese können dann analysiert und entsprechend der interessierenden Fragestellen ausgewertet werden.

Ziel des Projekts ist die Erstellung eines Vorschlags für einen nationalen Standard (DIN-Spezifikation) eines offenen Provenance-Modells. Dieser Vorschlag soll auf Basis bereits bestehender offener Provenance-Modelle erstellt werden. Insbesondere auf Grundlage des Open Provenance Modells (OPM) und dessen Weiterentwicklung Provenance Data Model (PROV-DM). Im Projekt sollen dazu diese existierenden Modelle evaluiert und ggf. an nationale Bedürfnisse angepasst werden. Im Gegenzug sollen Vorschläge und Ideen in die internationalen Standardisierungsgremien, insbesondere das World Wide Web Consortium (W3C), eingebracht werden.

Der Vorschlag für einen nationalen Standard praxisrelevant, praktikabel und einsatzbereit sein. Die Praxisrelevanz soll durch Evaluation mit praxis- und industrienahen Anwendungen verschiedener Branchen bewiesen werden (im Vorhaben insbesondere durch Anwendungen aus den Ingenieurwissenschaften, der Medizin und der Klima- und Meeresforschung). Praktikabilität soll durch möglichst einfach und anwendungsnah gestaltete Methodiken und Schnittstellen zu Provenance-Datenbanken erreicht werden. Die Einsatzbereitschaft soll durch Bereitstellung einer Provenance-Datenbank als frei verfügbare Open-Source-Software und durch Bereitstellung eines übersichtlichen Handbuchs hergestellt werden.

 
Laufzeit
01.08.2012 - 31.07.2014
 

Kontakt
Andreas Schreiber
Deutsches Zentrum für Luft- und Raumfahrt (DLR)

Simulations- und Softwaretechnik
, Verteilte Systeme und Komponentensoftware
Tel: +49 2203 601-2485

Mobil: +49 173 5231013

Fax: +49 2203 601-3070

E-Mail: Andreas.Schreiber@dlr.de
URL dieses Artikels
http://www.dlr.de/sc/desktopdefault.aspx/tabid-8073/13831_read-35162/
Texte zu diesem Artikel
PROVENANCE - Enabling and supporting provenance in Grids for complex problems (http://www.dlr.de/sc/desktopdefault.aspx/tabid-1262/1765_read-3191/usetemplate-print/)
Verteilte Systeme und Komponentensoftware (http://www.dlr.de/sc/desktopdefault.aspx/tabid-1199/1657_read-3066/usetemplate-print/)