11/2024 - Projektexplanation und Research Updates des ODIX Projekts
Viel Wissen steckt auch heute noch in verschiedenen Dokumenten, beispielsweise PDFs. Dies reicht in technischen Bereichen wie denen des DLR von Protokollen diverser (Groß-)Anlagen bis zu Datenblättern und anderen Texten. Diese Dokumente richten sich allerdings vorrangig an Menschen und entziehen sich dadurch oftmals einer automatisierten Verarbeitung. Damit lässt sich dieses Wissen schwer für Analysen und weiteren Erkenntnisgewinn nutzen. Teilweise ist sogar unbekannt, welche Informationen bereits vorliegen.
Ziel von ODIX ist es, Methoden zu entwickeln, die das in Dokumenten sowie anderen Quellen (bspw. Messreihen, Prozessdaten) enthaltene Wissen derart aufbereiten, dass es sowohl einer direkten Verwertung in KI-Anwendungen zugeführt als auch durch Menschen untersucht und analysiert werden kann. Hierzu werden zunächst faktische Informationen aus den Dokumenten extrahiert und mittels semantischer Konzepte annotiert. Der sich daraus ergebende Wissensgraph wird zusammen mit anderen erhobenen Daten in einem Datenmanagementsystem vorgehalten und mit diesen Daten verknüpft. Auf dieser Basis werden schließlich Schnittstellen sowohl für die menschliche wie auch automatisierte Nutzung dieses nun strukturierten Wissens entwickelt. Im Projekt liegt der Fokus auf den Anforderungen und Dokumenten der am Projekt beteiligten Domäneninstitute.
Das Projekt startete Anfang 2024 und bisher haben wir vor allem Anforderungen definiert, den Stand der Technik betrachtet und Pläne zur Umsetzung des Projekts detailliert. Ein erstes Paper zu Konzepten im Projekt ist eingereicht.
Sollte es Fragen zum Projekt geben oder Interesse an Austausch: Gerne bei uns melden!