gms | German Medical Science

GMS Medizin — Bibliothek — Information.

Arbeitsgemeinschaft für Medizinisches Bibliothekswesen (AGMB)

ISSN 1865-066X

Der Weg zum Data Librarian über einen Zertifikatskurs: Ein Erfahrungsbericht

Becoming a data librarian via a certificate course: A field report

Case Report Personalgewinnung und -entwicklung

Suche in Medline nach

  • corresponding author Uta Parmaksiz - ZB MED – Informationszentrum Lebenswissenschaften, Abteilungen Forschungsdatenmanagement / Digitale Langzeitarchivierung, Köln, Deutschland

GMS Med Bibl Inf 2024;24(1):Doc08

doi: 10.3205/mbi000591, urn:nbn:de:0183-mbi0005918

Veröffentlicht: 13. September 2024

© 2024 Parmaksiz.
Dieser Artikel ist ein Open-Access-Artikel und steht unter den Lizenzbedingungen der Creative Commons Attribution 4.0 License (Namensnennung). Lizenz-Angaben siehe http://creativecommons.org/licenses/by/4.0/.


Zusammenfassung

Die fortschreitende Digitalisierung der Wissenschaft verändert die traditionelle Rolle der Beschäftigten an wissenschaftlichen Bibliotheken. Der Fokus erweitert sich zunehmend auf Themen rund um Open Science und die Nachvollziehbarkeit von Forschungsprozessen und -ergebnissen. Der Umgang mit den stetig wachsenden Datenmengen stellt höhere Anforderungen an die technische Expertise und schafft völlig neue Aufgabenbereiche in den Einrichtungen. Das dafür notwendige Wissen fehlt noch weitgehend als Inhalt in den bibliothekarischen Studiengängen und ist nur sporadisch in der Tiefe und im Kontext zu erlernen. Der an der TH Köln angebotene Zertifikatskurs „Data Librarian“ setzt an dieser Lücke an und hat zum Ziel, in einer Kombination aus angeleiteter Selbstlernphase und Präsenzveranstaltungen über einen Zeitraum von neun Monaten grundlegende Datenkompetenzen zu vermitteln. Ob und wie dies gelingen kann, berichtet eine Teilnehmerin in diesem Beitrag.

Schlüsselwörter: Data Librarian, Open Science, Datenmanagement, Weiterbildung, Zertifikatskurs, Datenkompetenz

Abstract

The advancing digitalisation of science is changing the traditional role of employees at academic libraries. The scope is increasingly expanding to include topics relating to open science and the reproducibility of research processes and its results. Dealing with the ever increasing amounts of data requires more technical expertise and creates an entirely new range of tasks in the institutions. The required knowledge is still largely lacking as subject matter in library study programmes and can only be acquired sporadically in depth and in context. The ‘Data Librarian’ certificate course offered at TH Köln addresses this gap and is designed to teach basic data skills over a period of nine months in a combination of guided self-study phases and in-person sessions. In this article, a participant reports on whether and how this can be achieved.

Keywords: data librarian, open science, data management, further education, certificate course, data competence


1 Ausgangslage: Datenkompetenz gesucht

Meine Bewerbung für den Zertifikatskurs „Data Librarian“ war persönlich motiviert: Ich habe einen bibliothekarischen Hintergrund und meine Ausbildung zu einer Zeit abgeschlossen, als die elektronische Datenverarbeitung noch nicht den Berufsalltag bestimmte. Seitdem ist mir – wie den meisten meiner Kolleg:innen – das kontinuierliche Erwerben neuer Arbeitstechniken vertraut. So baute ich nach einem hausinternen Wechsel bei ZB MED – Informationszentrum Lebenswissenschaften, von der Erwerbung (Lizenzierung von E-Journals) in den Bereich Open Science, wiederum sukzessiv Fachkenntnisse für meine neuen Tätigkeitsbereiche Forschungsdatenmanagement und Digitale Langzeitarchivierung auf. Das glückte bis zu einem gewissen Grad, auch dank der Unterstützung meiner Vorgesetzten und Kolleg:innen, jedoch vermisste ich zunehmend eine tiefere und methodischere Erschließung von Zusammenhängen. Auch wollte ich lernen, manuelle Tätigkeiten automatisieren zu können, anstatt Daten beispielsweise in Excel-Listen aufwändig zu „verarbeiten“.

Aus unserem Haus hatten bereits Kolleginnen den Zertifikatskurs „Data Librarian“ an der TH Köln erfolgreich absolviert, ihre zunehmende Kompetenz und technisches Know-How wurden schnell ersichtlich. Mit Hilfe ihres Fazits über den Kurs „sehr gut, aber zeitintensiv“ beschloss ich die nächsten neun Monate zu investieren. Nach Gesprächen mit meinen Vorgesetzten und der Zusage der Unterstützung durch die Direktion (Kostenübernahme, Freistellung für Präsenztage) bewarb ich mich für den nächsten Kursdurchgang 2022/2023. Das Antragsverfahren selbst war unkompliziert, nach meiner Online-Bewerbung über die Webseite der TH Köln (https://www.th-koeln.de/weiterbildung/zertifikatskurs-data-librarian_63393.php, hier 2024/2025, 2022/2023 ist online nicht mehr verfügbar) und der Abgabe meines Motivationsschreibens erhielt ich zeitnah eine Zusage.


2 Zertifikatskurs

2.1 Organisatorisches

Der Zertifikatskurs „Data Librarian“ wurde unter wissenschaftlicher und fachlicher Leitung von Prof. Dr. Konrad Förstner, ZB MED – Informationszentrum Lebenswissenschaften und TH Köln, Institut für Informationswissenschaft, entwickelt. Das ZBIW – Zentrum für Bibliotheks- und Informationswissenschaftliche Weiterbildung der TH Köln organisierte den Kursablauf.

Über die Lernplattform Moodle wurden alle Termine, Zeiten und Zugangslinks bekannt gegeben, ebenso stellten die Dozent:innen ihre Skripte und Arbeitsunterlagen für die Selbstlernphasen darüber bereit. Die Lernfortschritte der Kursteilnehmer:innen wurden über die praktische Bearbeitung von Pflichtaufgaben oder über Quizfragen gefestigt. Fragen konnten in virtuellen Kursräumen oder per E-Mail gestellt werden, der Austausch über Diskussionsforen wurde gefördert.

Der Kurs startete mit drei Tagen Präsenz in Modul 1 „Hacken und experimentieren mit Daten“, dem Themenbereich mit dem höchsten technischen Anteil sowie der intensivsten Betreuung durch die Dozent:innen. Um einen reibungslosen Start trotz unterschiedlicher Hard- und Softwareumgebungen zu ermöglichen, fand wenige Tage vor Kursbeginn ein „Technik-Check“ statt. Die späteren Module beinhalteten jeweils eine virtuelle Einführungsstunde, gefolgt von einer Fragestunde innerhalb der Selbstlernphase. Abgeschlossen wurden die Module jeweils mit einem Präsenztag.

Als Abschluss war eine Teilnahmebescheinigung für die Anwesenheit bei allen Präsenzterminen vorgesehen. Im Rahmen einer im Modul 6 erstellten und bewerteten Projektarbeit konnte der Abschluss mit Zertifikat und Erlangung von 8 ECTS erreicht werden.

2.2 Inhalte

Die Kursinhalte waren thematisch in sechs Module bzw. Teilmodule (siehe Kursangebot: https://www.th-koeln.de/weiterbildung/zertifikatskurs-data-librarian_63393.php) zusammengefasst und wurden von Dozent:innen, Spezialist:innen des jeweiligen Fachgebiets, vermittelt.

Die ersten drei Module „Hacken und experimentieren mit Daten“, „Daten strukturieren, beschreiben, wiederauffinden“ und „Daten analysieren und darstellen“ bildeten mit Unix Shell und git/Github den Start in die Data Science-Welt. Die Programmiersprache Python wurde vermittelt, welche als einsteigerfreundlich bezeichnet werden kann. Zahlreiche auf besondere Funktionen spezialisierte Python-Programmbibliotheken („Libraries“) wie Pandas (Datenverarbeitung, Analyse und Darstellung), NumPy (numerische Rechnungen), Mathplotlib und seaborn (Darstellung in Graphen) wurden anwendungsbezogen vorgestellt und mittels (Haus-)Aufgaben vertieft.

Die Motivation „[to] Automate the boring stuff with Python“ – wie der Titel eines empfohlenen Buches von Al Sweigart [1] über Python treffend beschreibt – half nicht nur über anfängliche Schwierigkeiten hinweg. Weitere Kurseinheiten befassten sich mit Grundlagen des Information Retrieval, Suchmaschinen und Solr, statistischen Methoden, maschinellem Lernen sowie künstlicher Intelligenz. Damit war der Grundstein für die „Daten-Denke“ gelegt.

Das daran anschließende Modul 4 „Forschungs(daten)prozess verstehen und unterstützen“ führte in den Forschungskreislauf der offenen Wissenschaften ein. Dabei wurden Publikationsprozesse durchleuchtet (Open-Access-Finanzierung, Anforderungen der Forschungsförderung), ebenso wie die Qualitätssicherung (Review-Prozesse, Standards guter wissenschaftlicher Praxis) und bibliometrische Analysemöglichkeiten. Das Modul fokussierte dabei nicht nur auf Grundlagenwissen, sondern auch darauf, wie wissenschaftliche Bibliotheken jeweils unterschützen können und welche Herausforderungen bestehen.

Modul 5 „Nachhaltig und verantwortungsvoll handeln im Umgang mit Daten“ schärfte unseren Blick auf den Umgang mit Daten. Zum einen im Hinblick auf die Datenethik (Geschichte des Open Source, Spektrum offener Lizenzen) und zum anderen auf die Grundlagen der Digitalen Langzeitarchivierung (organisatorische und technische Seite, Eigenschaften digitaler Objekte).

Der Zertifikatskurs schloss mit einem Projektmodul ab, in dem eine Praxis- oder Theoriearbeit zu einem selbst gewählten Thema bearbeitet wurde. Sie diente der selbstständigen Anwendung und Vertiefung der neuen Fähigkeiten und des behandelten Lernstoffes. Das Thema konnte auch aus dem eigenen Tätigkeitsbereich stammen. Die Ergebnisse wurden in einer Abschlussveranstaltung von den Teilnehmer:innen vorgestellt und zur Diskussion gestellt, anschließend erfolgte die Abgabe der Zusammenfassung an den betreuenden Dozenten.

2.3 Selbstlernphase

Während des gesamten Kurses war es entscheidend, die neuen Kenntnisse selbstmotiviert zu bearbeiten, die Begleitung durch die jeweiligen Dozent:innen zu nutzen und den Austausch in der Gruppe zu suchen. Zum kurseigenen Leitspruch wurde schnell, eigene Fehler und auch die anderer Teilnehmer:innen als Lernchancen zu sehen – das half (und hilft bis heute!) zwischenzeitliche Frustrationsstrecken zu überwinden.

Bei der Erarbeitung neuer Thematiken ist der Austausch in einer Gruppe nicht zu unterschätzen und besonders in Fernkursen kann das Zusammenkommen schwierig sein. Jedoch hatten sich Lerngruppen – für die, die wollten – recht bald gebildet. Ursprünglich offiziell aufgeteilt, später spontan zusammengefunden. Die sich entwickelnde Dynamik war interessant, auch und gerade weil unterschiedliche Grundvoraussetzungen aufeinandertrafen: frisch Studierte, weniger frisch Studierte, gar nicht Studierte; technisch versierte Teilnehmer:innen und technische Novizen oder ganz unterschiedliche Berufserfahrungen. Die anfänglich eher unvereinbar erscheinenden Gegebenheiten schafften mit der Zeit Verständnis für die alltägliche Diversität und schulten die eigene Kommunikationskompetenz – Fähigkeiten, die im Arbeitsbereich Data Librarian als Vermittler zwischen Bibliothek und IT gut anwendbar sind.

Im nebenberuflichen Studium war während der neun Monate ein gutes Zeitmanagement unabdingbar. Der Grad der Bewältigungsmöglichkeit verlief mitunter zwischen „recht sportlich“ bis „ambitioniert“ – entsprechend der Vorkenntnisse, der Affinität sowie der persönlichen oder familiären Umstände. Manches musste in langen Nächten erarbeitet werden, einiges wurde schweren Herzens „priorisiert“.


3 Erkenntnisse

3.1. Was nehme ich mit?

Der Zertifikatskurs war mein Einstieg in die Datenwelt, Python meine erste Programmiersprache. Mit einem erweiterten Verständnis kann ich an technische Fragestellungen herangehen und habe mehr Mut und Neugier gewonnen, Dinge auszuprobieren und Know-How zu erarbeiten. In meinem Tätigkeitsbereich gab es bislang noch keine konkreten Anwendungsfälle, um Anwendungen für Daten zu schreiben. Jedoch war es mir bereits möglich, von Kolleg:innen erstellte Programmskripte zu lesen, mich einzuarbeiten und die Anwendung zu erweitern.

Die Gesamtheit der Module hat mir ein besseres Verständnis von forschungsnahen Diensten an wissenschaftlichen Bibliotheken ermöglicht, auch bin ich fachlich sicherer geworden. Die für mich wichtige Auseinandersetzung mit dem State of the Art im nationalen und internationalen Bibliothekswesen habe ich in meiner Abschlussarbeit „Digital Curation Checklist: Entwicklung eines Workflows für die Annahme von Digitalen Objekten in Repositorien“ umgesetzt und fand später Anwendung in der Neufassung unserer Publikationsleitlinie im PUBLISSO-Fachrepositorium Lebenswissenschaften.

3.2 Wie geht es weiter?

Der Weg zum Erfolg eines Data Librarian führt über ein Umfeld, das ermöglicht, die neuen Kenntnisse aktiv umzusetzen. Dazu gehören nicht nur Zeitkontingente zum Vertiefen und Testen oder die Planung konkreter Projekte, sondern auch eine innerbetriebliche Offenheit, bisherige Abläufe zu hinterfragen und Tätigkeiten des bzw. der frisch gebackenen Data Librarian neu zu priorisieren.

Die hausinterne IT-Infrastruktur sollte erlauben, benötigte Software und Tools mit wenig Aufwand und Zeitverzug in die eigene Arbeitsumgebung herunterzuladen und nutzbar zu machen. Austausch und Netzwerke helfen über Hürden hinweg und sollten zeitlich und organisatorisch unterstützt werden.


4 Fazit

Der Zertifikatskurs deckt ein umfangreiches thematisches Spektrum ab. Für den technischen Teil ist es zweifelsfrei von Vorteil, ein analytisch-mathematisches Verständnis und Berufserfahrung mitzubringen, um Anwendungsbeispiele leicht dem Neuerlernten zuordnen zu können. Die wichtigste Voraussetzung ist jedoch Offenheit, sich in neue Themen und Aufgabenfelder einzuarbeiten. Ebenso von Vorteil sind gute Englischkenntnisse, da Programmiersprachen und in großen Teilen die im Kurs verwendete Literatur bzw. für das Selbststudium hilfreiche Anwenderforen und Tutorials in englischer Sprache vorliegen und Netzwerke in der Regel international agieren.

Für die praktische Umsetzung ist die Schaffung eines entsprechenden Wirkungsfeldes wichtig. Der Austausch mit Kolleg:innen aus dem Bereich Data Science bzw. Software-Entwickler:innen beschleunigt den weiteren Lernprozess, ausgebildete Informatiker:innen werden durch Data Librarians allerdings nicht ersetzt werden können.

Ein Data Librarian benötigt Beharrlichkeit und Spaß am lebenslangen digitalen Lernen sowie Experimentierfreude und Frustrationstoleranz. In wissenschaftlichen Bibliotheken braucht es Flexibilität und Gestaltungswillen, um mit den rasanten Entwicklungen und den immer komplexer werdenden Aufgaben im Informationsbereich Schritt halten zu können.


Anmerkungen

ORCID der Autorin

Uta Parmaksiz: 0000-0002-0087-5056

Interessenkonflikte

Die Autorin erklärt, dass sie keine Interessenkonflikte in Zusammenhang mit diesem Artikel hat.


Literatur

1.
Sweigart A. Automate the Boring Stuff with Python. Practical Programming for Total Beginners. 2nd ed. No Starch Press; 2020. Verfügbar unter: https://automatetheboringstuff.com/ Externer Link