HPDA-System Kratos



Der High-Performance-Data-Analysis Cluster (HDPA) „Kratos“ ist das zentrale Arbeitswerkzeug des DLR-Instituts für Datenwissenschaften in Jena. Mit einer Rechenleistung von 1,62 Petaflops und einer Speicherkapazität von 1,15 Petabyte unterstützt er interdisziplinäre Forschungsfragen in den Bereichen Datenmanagement, Datengewinnung, Datenanalyse und Intelligenz, die über das Institut hinaus die Kompetenzen des DLR in den Datenwissenschaften stärken.
Als HPDA-Cluster ist Kratos auf die Verarbeitung großer Datenmengen spezialisiert, insbesondere mit Algorithmen des Deep Learning. Die Anlage wurde 2020 eingeweiht und 2021 um sechs weitere GPU-Knoten mit 48 NVIDIA A100 GPUs erweitert. Sowohl die ursprüngliche Installation als auch die Erweiterung sowie der aktuelle Support werden von Megware durchgeführt.
- 116 CPU-Knoten mit Intel® Xeon® Platinum-Prozessoren (insgesamt 6144 physische Kerne),
- 2 Fat-Knoten mit je 1,5 Terabyte RAM,
- 4 GPU-Knoten mit 32 NVIDIA Tesla V100 GPUs,
- 6 GPU-Knoten mit 48 NVIDIA Tesla A100 GPUs,
- ein paralleles Dateisystem mit 1,15 Petabyte nutzbarem Speicher und eine Hochgeschwindigkeits-Netzwerkverbindung (Intel Omni-Path, 100 GBit/s).
Der Cluster ist am Universitätsrechenzentrum (URZ) der Friedrich-Schiller-Universität Jena am Johannisfriedhof untergebracht und über eine Anbindung (1 GBit/s) mit dem Deutschen Forschungsnetz (DFN) verbunden. Dies ermöglicht den Zugriff nicht nur für das DLR, sondern auch für Kooperationspartner wie andere Forschungseinrichtungen und KMU.
Für das Institut für Datenwissenschaften dient Kratos der Bearbeitung Fragestellungen im Bereich von:
- Datengewinnung und -mobilisierung (DMO): Sicherstellung von Datenqualität, -verfügbarkeit und -zugriff durch userzentrierte Methoden, sichere Softwareentwicklung und multimodale Informationsgewinnung.
- Datenmanagement und -aufbereitung (DMA): Entwicklung von Methoden für Informationsextraktion, Interoperabilität heterogener Daten, semantische Modelle und effiziente Datenverwaltung.
- Datenanalyse und -intelligenz (DAI): Anwendung von Maschinellem Lernen, prozesswissenintegrierter Datenexploration und Kausaler Inferenz zur Erkennung von Mustern und Abhängigkeiten in großen Datensätzen.
Zudem wird Kratos in der DLR Quantum Computing Initiative (QCI) eingesetzt, z. B. in Projekten wie QCoKaIn (quantenbasierte Kausale Inferenz für Anomalieerkennung), Quant²AI (Bewertung quantaler KI-Methoden) und QCI-Connect (Quantum-as-a-Service-Plattform).
Weitere Informationen: Pressemitteilung zur Einweihung