DataFinder



Der DataFinder ist eine leichtgewichtige Anwendungssoftware zur Verwaltung technisch-wissenschaftlicher Daten. Er wurde entwickelt, um große Datenmengen zu verwalten und ermöglicht die Speicherung von Daten über eine Reihe verschiedener Speicher-Schnittstellen (z.B. WebDAV, FTP, GridFTP, OpenAFS oder TSM). Die Struktur der Daten und beschreibende Metadaten werden in XML-Format auf einem zentralen Server gespeichert und können über das standardisierte Protokoll WebDAV bearbeitet werden.

Der DataFinder besitzt folgende Hauptfunktionalitäten:

  • Up- und Download von Daten.
  • Versehen der Daten mit standardisierter und benutzerdefinierter Meta-Information.
  • Eine Suchfunktion, in der mehrere Suchterme verknüpft werden können.
  • Abarbeitung von Skripten zur Automatisierung von Arbeitsabläufen (z.B. automatisches Up- und Download oder Durchführung von Rechnungen).
DataFinder-GUI in der Benutzeransicht
zum Bild DataFinder-GUI in der Benutzeransicht

Die Verwaltung der Datenstrukturen an einer zentralen Stelle und die Beschreibung der Daten mit standardisierter Meta-Information erleichtern das Auffinden von Daten wesentlich und vermeiden damit Doppelarbeit. Auch kann ein Anwender Teilergebnisse oder Eingabedaten anderer Berechnungen, die schon auf Servern vorhanden sind, für seine aktuelle Arbeit nutzen, ohne die gleichen Daten noch einmal erzeugen zu müssen. Das flexible Metadaten-Konzept erlaubt dem Anwender ferner, die auf den Servern vorhandenen Daten mit zusätzlicher Meta-Information zu versehen.

Eine Datenmanagement-Lösung mit dem DataFinder setzt serverseitig auf offene und flexible Standards wie das WebDAV-Protokoll und bleibt dadurch leicht erweiterbar und flexibel. Aktuell unterstützte WebDAV-Server sind zum einen der Tamino XML Server der Software AG als kommerzielle Lösung und der aus einem Open-Source-Projekt hervorgegangene WebDAV-Server Catacomb. Diese Server erlauben serverseitige Suche sowie die automatische Versionisierung von Dokumenten und Daten.

DataFinder für Datenmanagement im Grid

Der DataFinder kann als allgemeines einfach zu benutzendes Tool für wissenschaftliches Datenmanagement in Grids und Clouds eingesetzt werden. Er wurde im Rahmen des D-Grid Integrationsprojekts (DGI) um Schnittstellen zu Grid-Ressourcen (z.B. GridFTP und SRB) erweitert und wird im D-Grid-Projekt AeroGrid um Schnittstellen zu UNICORE 6 erweitert und als Benutzerschnittstelle für die Durchführung komplexer Simulationen im Grid eingesetzt.

Verfügbarkeit

Der DataFinder ist als Open-Source-Software unter der BSD-Lizenz verfügbar. Erweiterte und angepasste Versionen des DataFinder können auf Anfrage entwickelt bzw. bereitgestellt werden.

Links



Kontakt
Carina Haupt
Deutsches Zentrum für Luft- und Raumfahrt (DLR)

Simulations- und Softwaretechnik
, Verteilte Systeme und Komponentensoftware
Tel: +49 30 67055-248

Fax: +49 30 67055-202

E-Mail: Carina.Haupt@dlr.de
URL dieses Artikels
http://www.dlr.de/sc/desktopdefault.aspx/tabid-1273/1756_read-3140/
Texte zu diesem Artikel
Technologien und Architektur (http://www.dlr.de/sc/desktopdefault.aspx/tabid-1280/1757_read-3141/usetemplate-print/)
Arbeitsweise (http://www.dlr.de/sc/desktopdefault.aspx/tabid-1280/1757_read-3142/usetemplate-print/)
WebDAV-Server Catacomb (http://www.dlr.de/sc/desktopdefault.aspx/tabid-4647/7676_read-11619/usetemplate-print/)
Open Source (http://www.dlr.de/sc/desktopdefault.aspx/tabid-5951/9688_read-19161/usetemplate-print/)
DGI - D-Grid Integrationsprojekt (http://www.dlr.de/sc/desktopdefault.aspx/tabid-1262/1765_read-3196/usetemplate-print/)
AeroGrid – Grid-basierte Zusammenarbeit zwischen Industrie, Großforschung und Universitäten in der Luftfahrtforschung (http://www.dlr.de/sc/desktopdefault.aspx/tabid-1262/1765_read-8383/usetemplate-print/)