Структура за темами
- DiSEA-Tutorial
- Розділ 4: Risikofaktoren erkennen
- Урок 4.4:
- DiSEA-Tutorial
- Розділ 4
- Урок Урок 4.4: :
-
-
Datenbasis
Die herangezogenen Daten stammen aus mehreren Quellen und erfordern eine sorgfältige Aufbereitung, um sie für die Analyse und das Dashboard nutzbar zu machen.
-
Datenquellen für das Dashboard
Das Projekt DiSEA greift auf Daten aus verschiedenen Hochschulen aus dem VFH-Verbund und deren Systemen zurück. Zu den Datenquellen gehören:
- Verwaltungsdaten: Diese stammen von drei Fachhochschulen im Verbund: die Berliner Hochschule für Technik (BHT), die Technische Hochschule Brandenburg (THB) und die Technische Hochschule Lübeck (THL).
- Moodle-Log-Daten: Von insgesamt sieben Hochschulen wurden die Log-Daten der Lernplattform Moodle seit dem Wintersemester 2021/22 und teilweise sogar seit dem Wintersemester 2020/21 ausgewertet.
Bis zum 05.06.2023 haben ca. 1600 Studierende ihr Einverständnis gegeben, dass ihre Daten für dieses Projekt verwendet werden dürfen.
-
Datenkategorien
Die gesammelten Daten lassen sich in verschiedene Kategorien unterteilen. Diese unterscheiden sich in ihrer Struktur und Verwendung:
-
grundlegende Daten über die Studierenden, wie
- Geburtsjahr
- Geschlecht
- Hochschule
- Studiengang
- Semester der Immatrikulation
- Semester der Exmatrikulation
- Semester der Erst-Immatrikulation
Daten über den Studienverlauf, wie
- Semester
- Fachsemester
- Hochschulsemester
- Studierstatus
Daten zu Prüfungsnoten und -ergebnissen, wie
- Semester
- Modul
- Moodle-Kurs
- Leistungsart
- Versuch
- Note
- Leistungsstatus
spezifische Daten zu belegten Modulen und Kursen, wie
- Modul-ID
- Titel
- Plansemester
- Hochschule
- Studiengang
Daten zu bestandenen und nicht bestandenen Prüfungen sowie Abschlüssen, wie
- Jahr
- Abschlussart
- Note
-
Erfahrungen aus dem Projekt
Die Daten für dieses Projekt zu sammeln und zu integrieren, war mit einer Reihe von Herausforderungen verbunden.
-
Datenschutz und Bürokratie
Der Datenschutz ist von entscheidender Bedeutung für die Datenakquise und -verarbeitung in diesem Projekt. Bei der Verarbeitung von Studierendendaten ist daher mit besonderer Sorgfalt vorzugeben. Das brachte mehrere Herausforderungen mit sich:
- Verzögerungen durch unklare Vorgaben: Nicht überall waren die Anforderungen an die spezifischen Datenschutzmaßnahmen klar definiert. So war es bspw. schwierig festzustellen, welche Daten überhaupt genutzt werden dürfen, und wie sie ggf. anonymisiert werden müssen.
- Einwilligung der Studierenden: Um die Daten auswerten zu dürfen, wurde das Einverständnis der Studierenden eingeholt. Diese Einwilligung ist nicht nur rechtlich notwendig, sondern auch für den Erfolg des Projekts entscheidend, da die Akzeptanz der Studierenden eine maßgebliche Rolle spielt.
-
Pseudonymisierung der Daten
Um den Datenschutz zu gewährleisten, wurden die akademischen Daten und die Log-Daten zwar verknüpft, allerdings im Anschluss daran pseudonymisiert. Das bedeutet, dass keine Rückschlüsse auf konkrete Personen oder Standorte möglich sind. Nur Datensätze, bei denen alle Kursteilnehmenden ihr Einverständnis gegeben haben, werden in die Analyse einbezogen.
-
Gesetzesgrundlage für die Datenerfassung
Es ist wichtig hervorzuheben, dass nur Daten genutzt werden, die ohnehin im akademischen Betrieb anfallen, wie die in §3 HStatG vorgeschriebenen akademischen Daten sowie die Log-Daten, die Moodle standardmäßig speichert.
-
Weitere Herausforderungen
Das Projekt hatte mit weiteren spezifischen Herausforderungen zu kämpfen, die es zu bewältigen galt:
- Kleiner, unausgeglichener Datensatz: Aufgrund der beschränkten Auswahl der Hochschulen und der begrenzten Anzahl von Studierenden, die ihre Einwilligung erteilt haben, ist der Datensatz vergleichsweise klein und nicht immer gut ausbalanciert. Dies erschwert die Analyse und die Modellierung für zuverlässige Vorhersagen.
- Änderungen in den Studienordnungen: Die Studienordnungen wurden während der Projektlaufzeit mehrfach geändert. Dadurch waren nicht alle Daten für Vorhersagen gleichermaßen geeignet, da sich die Anforderungen und Bedingungen für die Studierenden veränderten.
- Heterogene Verwaltungsdaten: Ein großes Problem war die Integration der Verwaltungsdaten, da diese in verschiedenen Systemen verwaltet wurden und oft keine einheitlichen Standards vorlagen. Beispielsweise änderte die BHT während der Projektlaufzeit ihr Informationssystem, was die Datenintegration zusätzlich erschwerte.
- Corona-Pandemie: Die Pandemie beeinflusste die Kommunikationsprozesse und veränderte die Datenlage, da viele Studierende aufgrund der Umstellung auf digitale Lehre anders auf die Materialien und Angebote zugriffen als zuvor.
-