Bookmark
Wissenschaftliche Tätigkeit / Projektarbeit

Erforschung der Entstehung von Data Biases

Beginn

ab sofort

Dauer

3 Jahre

Vergütung

Entgeltgruppe 13 TVöD

Beschäftigungsgrad

Vollzeit (Teilzeit möglich)

Der Schwerpunkt des DLR-Instituts für Datenwissenschaften in Jena liegt darin, Lösungen für die neuen Herausforderungen der Digitalisierungsära zu finden. Die Forschung konzentriert sich dabei auf die Bereiche Datenmanagement, IT-Sicherheit und Smart Systems (Industrie 4.0).

Hochwertige Daten bilden die Grundlage KI-gestützter Anwendungen und Services. Dies gilt vor allem für lernende KI-Systeme. Diese benötigen große Mengen gelabelter Trainingsdaten aus denen Modelle erlernt werden können. Sind Trainingsdaten verfälscht, besteht die Gefahr, dass Data Biases in die erlernten Modelle übernommen werden. Entscheidungen oder Prognosen, die auf den Ergebnissen solcher Modelle abgeleitet werden, beruhen daher unter Umständen auf falschen Annahmen. Bereits bei der Erstellung von Trainingsdaten für maschinelle Lernverfahren muss dies berücksichtigt werden. Die interdisziplinäre Arbeitsgruppe „Datenverfügbarkeit und -bereitstellung“ erforscht und entwickelt diesbezüglich Methoden und Werkzeuge zur Erstellung objektiver und repräsentativer Trainingsdaten als Basis für vertrauenswürdige KI-Anwendungen und sucht Sie zur Unterstützung im Team.  

Schwerpunkte Ihrer Arbeit ist die Erforschung der Entstehung von Data Biases, deren Manifestierung in Trainingsdaten und Modellen sowie darauf aufbauend die Entwicklung verbesserter Methoden und Werkzeuge zur Erstellung möglichst objektiver und repräsentativer Trainingsdaten. Ihre Forschungsarbeiten sind an der Schnittstelle zwischen informatischer sowie verhaltens- und gestaltungsorientierter Forschung angesiedelt.

Ihre Aufgaben im Rahmen dieser Stelle beinhalten:

  • Durchführung von Nutzerstudien zur systematischen Untersuchung der Wirkprinzipien bei der Entstehung eingebrachter Data Biases (durch menschliche Annotatoren) während des Labelingprozesses unter Einfluss bestimmter Charakteristika der Datenannotoren (z. B. Meinungen, Präferenzen oder Motivationen) auf die Qualität der erstellten Daten und die Wirkung kognitiver Biases
  • Systematische Analyse von Data Biases, welche aus der Auswahlstrategie der Daten für Trainings- und Evaluationsdatensätze resultieren (z. B. Unter- oder Überrepräsentation bestimmter Bevölkerungsgruppen)
  • Experimentelle Untersuchung der Wirkprinzipien bei der Entstehung und möglichen Verstärkung von Data Biases, welche durch den Erstellungsprozess der Daten induziert werden (u. a. Untersuchung des Einflusses von Annotationsaufgabe und -komplexität sowie Einfluss von Inzentiven)
  • Konzeption, Umsetzung und Evaluation von Verfahren zur Erstellung möglichst objektiver und repräsentativer Trainingsdaten auf Basis empirisch gewonnener Erkenntnisse zur Entstehung und Wirkung von Data Biases
  • Systematische Untersuchung mit dem Ziel zugrundeliegende Prinzipien bei der Manifestation und Wirkung von Data Biases mittels maschineller Lernverfahren erlernter Modelle besser zu verstehen

Ihre Qualifikation:

  • abgeschlossenes wissenschaftliches Hochschulstudium (Master/Diplom) der Informatik, der Wirtschaftsinformatik, Mensch-Computer-Interaktion oder eines anderen relevanten Hochschulstudienganges sofern notwendige Fachkenntnisse und Erfahrungen nachgewiesen werden
  • erste Erfahrung in der selbstständigen und eigenverantwortlichen Bearbeitung von Forschungsaufgaben
  • Fachkenntnisse und erste Erfahrung (z. B. über Studienprojekt oder Abschlussarbeit) im Bereich Statistik und/oder maschinelle Lernverfahren
  • Offenheit für die Arbeit in interdisziplinären Projekten
  • Bereitschaft zur nationalen und internationalen Kooperation mit Partner/innen in Wissenschaft und Praxis
  • sehr gute Deutsch- oder Englischkenntnisse in Wort und Schrift
  • Fachkenntnisse und erste Erfahrung (z. B. über Studienprojekt oder Abschlussarbeit) im Bereich Human Factors sowie in der Durchführung von Nutzerstudien wünschenswert
  • Programmierkenntnisse (z. B. Java, C#, Python, JavaScript o. ä.) von Vorteil
  • Fachkenntnisse und erste Erfahrung im Bereich der Entstehung, Manifestation und Wirkung von Data Biases von Vorteil

Ihr Start:

Freuen Sie sich auf einen Arbeitgeber, der Ihr Engagement zu schätzen weiß und Ihre Entwicklung durch vielfältige Qualifizierungs- und Weiterbildungsmöglichkeiten fördert. Unser einzigartiges Arbeitsumfeld bietet Ihnen Gestaltungsfreiräume und eine unvergleichbare Infrastruktur, in der Sie Ihre Mission verwirklichen können. Vereinbarkeit von Privatleben, Familie und Beruf sowie Chancengleichheit von Personen aller Geschlechter (w/m/d) sind wichtiger Bestandteil unserer Personalpolitik. Bewerbungen schwerbehinderter Menschen bevorzugen wir bei fachlicher Eignung.

  • Jetzt online bewerben
  • Sie können sich diese Stellenanzeige per E-Mail zusenden und Ihre Bewerbung am stationären Computer oder Laptop erstellen.

    Wir benötigen Ihre digitalen Bewerbungsunterlagen (PDF). Die Übermittlung wird von einigen Mobilgeräten nicht standardmäßig unterstützt. Bitte erstellen Sie Ihre Bewerbung an einem PC/Laptop.

    Bewerbung am PC erstellen

Fachliche/r Ansprechpartner/in

Dr. Friederike Klan
Institut für Datenwissenschaften

Tel.: +49 3641 30960-110

Nachricht senden

Kennziffer 68988

Personalbetreuung Berlin

Nachricht senden

DLR-Standort Jena

zum Standort

DLR-Institut für Datenwissenschaften

zum Institut