Projektbeschreibung
Die Validierung von Ergebnissen aus Geschäftsprozessen, Simulationen oder Experimenten ist in vielen Geschäfts- und Forschungsgebieten wichtig. Beispiele sind akademische „Reviews“ von Daten oder Veröffentlichungen, Audits finanzieller Transaktionen oder Überprüfung und Auditierung medizinischer Vorgänge.
Allgemein ist es bei Prozessen zur Erzeugung oder Verarbeitung von Daten oft wünschenswert, die Entstehung der Resultate nachvollziehen zu können. Das hat ganz praktische Vorteile. Man kann die Entstehung der Daten reproduzieren und ggf. die Daten erneut erzeugen. Oder man kann die Konformität des datenerzeugenden Prozesses entsprechend bestimmter geltender Regularien überprüfen. Schließlich ist es auch möglich, Beweissicherheit bzgl. Verwendung und Überprüfung der Daten zu erreichen.
Die Aufzeichnung detaillierter Informationen über die Entstehung und den Ursprung von Daten wird als Provenance bezeichnet. Basierend auf einem Modell des aufzuzeichnenden Prozesses („Provenance-Modell“) werden dabei alle relevanten Informationen des Prozesses in einer Datenbank gespeichert. Diese können dann analysiert und entsprechend der interessierenden Fragestellen ausgewertet werden.
Ziel des Projekts ist die Erstellung eines Vorschlags für einen nationalen Standard (DIN-Spezifikation) eines offenen Provenance-Modells. Dieser Vorschlag soll auf Basis bereits bestehender offener Provenance-Modelle erstellt werden. Insbesondere auf Grundlage des Open Provenance Modells (OPM) und dessen Weiterentwicklung Provenance Data Model (PROV-DM). Im Projekt sollen dazu diese existierenden Modelle evaluiert und ggf. an nationale Bedürfnisse angepasst werden. Im Gegenzug sollen Vorschläge und Ideen in die internationalen Standardisierungsgremien, insbesondere das World Wide Web Consortium (W3C), eingebracht werden.
Der Vorschlag für einen nationalen Standard praxisrelevant, praktikabel und einsatzbereit sein. Die Praxisrelevanz soll durch Evaluation mit praxis- und industrienahen Anwendungen verschiedener Branchen bewiesen werden (im Vorhaben insbesondere durch Anwendungen aus den Ingenieurwissenschaften, der Medizin und der Klima- und Meeresforschung). Praktikabilität soll durch möglichst einfach und anwendungsnah gestaltete Methodiken und Schnittstellen zu Provenance-Datenbanken erreicht werden. Die Einsatzbereitschaft soll durch Bereitstellung einer Provenance-Datenbank als frei verfügbare Open-Source-Software und durch Bereitstellung eines übersichtlichen Handbuchs hergestellt werden.