Artikel
Vom Bewerber zum Absolventen – Der lange Weg zum vollständigen Datensatz
Suche in Medline nach
Autoren
Veröffentlicht: | 20. August 2013 |
---|
Gliederung
Text
Zur Validierung der hochschuleigenen Auswahlverfahren (AdH) muss eine große und stetig wachsende Menge an Daten aus unterschiedlichen Quellen (hochschulstart, AdH-Daten, Studienergebnisse) zusammengefasst werden. Hauptprobleme sind hierbei ein effizientes Datenmanagement, die eindeutige Zuordnung der Personen über alle Datenquellen hinweg sowie die Sicherung der Datenqualität durch Dokumentation aller Quellen und vorgenommenen Datenveränderungen.
Der vollständige Weg der Daten vom Erhalt über die Dateiumbenennung und die Datenmigration in die Datenbank bis zur Bereitstellung für Auswertungen wird standardisiert. Mit einer relationalen Datenbank auf der Basis von 4D haben wir ein Datenbankmodell entwickelt, mit dem die Bewerber- und Studierendendaten verwaltet und für die wissenschaftliche Begleitung des Auswahlverfahrens anonymisiert bereitgestellt werden können. Eine wichtige Teilaufgabe der Datenbank ist der Abgleich von Personendaten für Bewerber, die sich in den Jahren 2008 bis 2012 mehrfach um einen Studienplatz beworben haben. Eine zweite wichtige Aufgabe ist die Verknüpfung der Bewerberdaten mit den Zulassungsquoten und den Studierendendaten. Unser Identity-Matching-Ansatz basiert auf Ähnlichkeiten zwischen Attributwerten durch String-basierte Vergleiche von unterschiedlichen Personenmerkmalen.
Durch die Einführung eines standardisierten Datenmanagements wurde die Grundlage zur Generierung gebündelter Datensätze geschaffen. Der aufbereitete Datenbestand ist konsistent und redundanzfrei. Die Nachvollziehbarkeit der Datenquelle sowie die Sicherstellung der Erhaltung des originalen Datenzustandes kann mittels der geschaffenen Tools gewährleistet werden. Die erstellten Werkzeuge optimieren den Arbeitsablauf und sind schnell anpassbar. Die Integration eines Linguistischen Identity Matchings als noch zuverlässigere und präzisere Methoden für den optimierten Abgleich von Personendaten stellt eine wichtige Teilaufgabe für die zukünftige Datenbankoptimierung dar. Eine weitere geplante Datenbank soll neben Exporten von Datenzusammenstellung die dazugehörige Syntax zur unkomplizierten Übernahme der Datenbelabelungen in die statistische Analyseanwendung SPSS generieren. Zusätzlich wird eine Dokumentation der Entwicklungen in einem Wiki aufgebaut. So kann eine hohe Transparenz des Datenmanagements sichergestellt werden. Dies verringert den Einarbeitungsaufwand der Auswerter erheblich und vereinfacht auch die Übergabe des Datenmanagements an nachfolgende Verantwortliche [1].