Die Gruppe AWA erforscht praxisrelevante Methoden und entwickelt modulare Softwaresysteme zur Analyse unstrukturierter Daten und Datenströme mit besonderem Fokus auf Textnachrichten in sozialen Medien. Diverse Online-Plattformen, wie z.B. Twitter oder Reddit, ermöglichen die aktive Beteiligung am weltweiten öffentlichen Diskurs. Die dabei generierten Daten sind oft frei zugänglich und können wertvolle Informationen für ein breites Spektrum von Anwendungen bieten.
Das Anwendungsportfolio der Gruppe adressiert derzeit die Bereiche zivile Sicherheit, Naturgefahren (Naturkatastrophen, extreme Wetterereignisse, Großschadens-lagen sowie die aktuelle Pandemie) und weitere Umwelteinwirkungen (z.B. Lärm) - ist aber nicht auf diese festgelegt.
Je nach Anwendung und Fragestellung gilt es zunächst die passenden Datenquellen zu identifizieren und entsprechend ihrer Potentiale und Risiken zu bewerten. Die aus den oft sehr großen Datenmengen zu extrahierenden anwendungsrelevanten Daten werden mit angepassten Beschaffungsstategien oder durch Methoden zur Filterung und Klassifikation erhoben. Inhalte (z.B. Texte und Bilder), Relationen (z.B. Kommentierung von Beiträgen, Verlinkungen zu anderen Plattformen) und Metadaten (z.B. Zeitspempel und Geolokation) bilden die Grundlage für vielfältige thematische und raumzeitliche Analysen. Dabei kommen Ansätze des überwachten und unüberwachten maschinellen Lernens, der Computerlinguistik sowie der Geostatistik zum Einsatz.
Aktuelle anwendungsbezogene Forschungsthemen: