gms | German Medical Science

GMS Medizin — Bibliothek — Information.

Arbeitsgemeinschaft für Medizinisches Bibliothekswesen (AGMB)

ISSN 1865-066X

Unterstützung des Grünen Weges zu Open Access an der Max-Planck-Gesellschaft

Support of the Green Road to Open Access within the Max Planck Society

Fachbeitrag

Suche in Medline nach

GMS Med Bibl Inf 2009;9(1):Doc06

doi: 10.3205/mbi000134, urn:nbn:de:0183-mbi0001340

Veröffentlicht: 16. Juni 2009

© 2009 Bruch et al.
Dieser Artikel ist ein Open Access-Artikel und steht unter den Creative Commons Lizenzbedingungen (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.de). Er darf vervielfältigt, verbreitet und öffentlich zugänglich gemacht werden, vorausgesetzt dass Autor und Quelle genannt werden.


Zusammenfassung

Die Max-Planck-Gesellschaft (MPG) unterstützt gleichrangig den Goldenen und den Grünen Weg zu Open Access praktisch und politisch nachhaltig.

Im Kontext des Grünen Wegs betreibt sie mit eDoc ein zentrales institutionelles Repositorium für die MPG. Die gleichnamige Software hierzu ist eine Eigenentwicklung. Aufbauend auf den Erfahrungen und Wünschen der Nutzer wird derzeit eine neue Anwendung (PubMan) basierend auf dem eSciDoc Framework institutsweise eingeführt. eSciDoc ist ein Kooperationsprojekt mit dem FIZ Karlsruhe und wird vom BMBF bis 2009 gefördert. Sämtliche Anwendungen und Services können als Open Source-Produkt kostenfrei nachgenutzt und weiterentwickelt werden.

Neben der Entwicklung und dem Betrieb technischer Infrastrukturen wird der Grüne Weg an der MPG durch die direkte und indirekte personelle Unterstützung der Wissenschaftler beim Publikationsprozess gefördert. In diesem Zusammenhang spielt auch der enge Austausch zwischen den einzelnen Max-Planck-Instituten, der Max Planck Digital Library und weiteren nationalen und internationalen Partnern eine wichtige Rolle.

Mit der Berliner Erklärung von 2003 und aktuell der Schwerpunktinitiative "Digitale Information" der Wissenschaftsallianz wird dieses Engagement für Open Access auch politisch vertreten.

In diesem Artikel werden neben eDoc bzw. PubMan die Open Access-Politik der MPG unter besonderer Berücksichtigung der Aktivitäten im Bereich des Grünen Weges vorgestellt und erläutert.

Schlüsselwörter: Open Access, Institutionelles Repositorium, Selbstarchivierung, Grüner Weg, wissenschaftliches Publizieren, Digitale Bibliothek, Berliner Erklärung

Abstract

The Max Planck Society (Max-Planck-Gesellschaft; MPG) with equal weight supports both the Golden and Green Road to Open Access in practice and politically in a sustainable way.

In the context of the Green Road it runs with eDoc a central institutional repository for the MPG. The software of the same name is an in-house development. Based on the experiences and wishes of the users, currently, a new application (PubMan) which is built upon the eSciDoc framework is introduced within the institutes. eSciDoc is a co-operation with the FIZ Karlsruhe and is funded until 2009 by the BMBF. All applications and services are Open Source and can therefore be re-used and be further developed.

Apart from the development and maintenance of technical infrastructures, the Green Road within the MPG is furthered via direct and indirect personal support for scientists during the publication process.

In this regard the close exchange between single Max Planck Institutes, the Max Planck Digital Library and other national and international partners plays an important role.

With the Berlin Declaration in 2003 and currently in the Priority Initiative “Digital Information” of the Alliance of the German Research Organizations this commitment for Open Access is also politically represented.

In this article are introduced and explained both eDoc and PubMan respectively as well as the Open Access Policy of the MPG with a special focus on the activities within the Green Road.

Keywords: Open Access, institutional repository, self-archiving, Green Road, scientific publishing, digital library, Berlin Declaration


Berliner Erklärung und der Grüne Weg in der MPG

Die fachliche Kommunikation ist ein unverzichtbarer Teil des wissenschaftlichen Forschungsprozesses. Die Entwicklung der Informations- und Kommunikationstechnologie (I&K-Technik) ermöglicht es einzelnen Wissenschaftlerinnen und Wissenschaftlern bzw. wissenschaftlichen Organisationen, die fachliche Kommunikation eigenständiger und vielfältiger zu organisieren, als dies bis vor nicht allzu langer Zeit möglich war.

In der von der Max-Planck-Gesellschaft (MPG) initiierten „Berliner Erklärung über den offenen Zugang zu wissenschaftlichen Wissen" (http://oa.mpg.de/openaccess-berlin/Berliner_Erklaerung_dt_Version_07-2006.pdf) aus dem Jahr 2003 heißt es hierzu:

"[...] Mit dem Internet ist zum ersten Mal die Möglichkeit einer umfassenden und interaktiven Repräsentation des menschlichen Wissens, einschließlich des kulturellen Erbes, bei gleichzeitiger Gewährleistung eines weltweiten Zugangs gegeben.

Wir, die Unterzeichner, fühlen uns verpflichtet, die Herausforderungen des Internets als dem zunehmend an Bedeutung gewinnenden Medium der Wissensverbreitung aufzugreifen. Die damit verbundenen Entwicklungen werden zwangsläufig zu erheblichen Veränderungen im Wesen des wissenschaftlichen Publizierens führen und einen Wandel der bestehenden Systeme wissenschaftlicher Qualitätssicherung einleiten. […]"

Die derzeitige Organisation des wissenschaftlichen Publikationswesens wird den Anforderungen der Wissenschaft und den Möglichkeiten, welche die Technik bietet, nicht gerecht, denn es ist mit vielfachen Beschränkungen und Segmentierung des Zugangs zum Wissen verbunden. Die MPG hat vor diesem Hintergrund mit der Max Planck Digital Library (MPDL; http://www.mpdl.mpg.de) eine zentrale Serviceeinrichtung ins Leben gerufen. Diese treibt in ihren beiden Abteilungen sowohl technische Entwicklungen, wie etwa das eSciDoc-Projekt (siehe unten), als auch eine auf die Zukunft ausgerichtete Informationsversorgung voran. Die hier ebenfalls angesiedelte Open Access Policy-Stelle hilft bei der Koordination und Kommunikation der einzelnen Aktivitäten innerhalb und außerhalb der MPG.

Die Open Access-kompatible Zugänglichmachung des wissenschaftlichen Wissens hat für die MPG große Bedeutung und wird sowohl über den Grünen (Selbstarchivierung bei der Publikation in traditionellen Verlagen) als auch den Goldenen Weg (Publikation in einer genuinen oder hybriden Open Access-Zeitschrift) unterstützt. Es geht der MPG um die Maximierung des gesamtgesellschaftlichen Nutzens der an ihren Instituten (MPIs) betriebenen Forschung.

Der Grüne Weg bietet die Chance, Open Access zu praktizieren, ohne gewohnte Veröffentlichungskanäle verlassen zu müssen. Allerdings wird das Selbstarchivieren durch die Bedingungen, welche die meisten Verlage mit dessen Tolerierung verbinden, kompliziert und verzögert. Aus Sicht der MPG ist ein Abbau dieser Hürden notwendig. Ein Weg zum Erreichen dieses Zieles könnten Vereinbarungen sein, welche die Erleichterung des Grünen Weges mit Zusagen verbinden, welche die Risiken, die von den Verlagen gesehen werden, reduzieren. Im Idealfall würde damit nicht nur der Handlungsspielraum der Wissenschaftlerinnen und Wissenschaftler erweitert, sondern die Übertragung der Artikel in die Repositorien von Verlagen erledigt.

Eine Entwicklung in diese Richtung würde mit der von einer steigenden Zahl von Forschungsförderern mit der Zusage von Fördermitteln verbundenen Anforderung, Open Access kompatibel zu publizieren, korrespondieren.

Es bleibt zu hoffen, dass die politischen Entscheidungsträger mit Zuständigkeit für Wissenschaft, Wirtschaft und Urheberrecht die Entwicklung des wissenschaftlichen Publikationswesens aufmerksam verfolgen, denn die derzeitig verbreiteten Beschränkungen des Zugangs zu Wissen hemmen nicht nur die wirtschaftliche Prosperität, sondern bremsen auch die Forschungsprozesse von denen oftmals die Lösung zentralster Probleme, z.B. im Bereich der medizinischen oder Klimaforschung, abhängen.

Die indirekte Unterstützung des Grünen Weges durch den Dialog, den die MPG mit Verlagen führt, wird durch direkte Serviceangebote an die Wissenschaftlerinnen und Wissenschaftler an den MPIs ergänzt. Insbesondere die Mitarbeiterinnen und Mitarbeiter der Institutsbibliotheken helfen den Autorinnen und Autoren, die jeweiligen Bedingungen für eine Selbstarchivierung zu recherchieren. Ihre Zuständigkeit umfasst abhängig vom Workflow im Institut meist auch die Komplettierung der Metadaten im institutionellen Repositorium zu den archivierten Texten.

Der Beschluss einer zentralen Aufforderung der MPG an ihre wissenschaftlichen Mitarbeiterinnen und Mitarbeiter zur Selbstarchivierung oder einem direkten Open Access kompatiblen Publizieren wird angestrebt.

Die weiterhin bestehenden praktischen Hürden, die bei der Selbstarchivierung überwunden werden müssen, verzögern eine umfangreiche Zugänglichmachung der Volltexte. Weshalb sich insbesondere die Open Access Policy-Stelle der MPG an Initiativen wie dem "Aktionsbündnis Urheberrecht für Bildung und Wissenschaft" (http://www.urheberrechtsbuendnis.de/index.html.de) beteiligt. Hier ist auch die Schwerpunktinitiative „Digitale Information“ (http://www.mpdl.mpg.de/projects/other/allianz_de.htm) der Allianz der deutschen Wissenschaftsorganisationen zu nennen, bei der in Arbeitsgruppen die verschiedenen Aspekte, darunter auch Open Access, einer nachhaltig integrierten Forschungsumgebung entwickelt werden.


Frühe Anwendung eines Institutionellen Repositoriums – eDoc

Bereits im Jahr 2001, zwei Jahre vor der Veröffentlichung der „Berliner Erklärung über den offenen Zugang zu wissenschaftlichen Wissen" wurde von der MPG die technische Entwicklung eines institutionellen Repositoriums auch systematisch vorangetrieben. Diese Aufgabe wurde am Heinz Nixdorf Zentrum für Informationsmanagement (ZIM) verortet, welches mittlerweile in die 2007 gegründete MPDL integriert wurde. Als Basis diente damals eine Vorversion eines Dokumentenservers, der am Fritz-Haber-Institut (FHI) der MPG entstanden war. Dieses System trägt den Namen eDoc (http://edoc.mpg.de) und wurde zum zentralen Repositorium für die rund 80 Institute der MPG ausgebaut. Es bildet in den einzelnen Institutskollektionen die wissenschaftlichen Publikationen der MPG ab. Da mit Hilfe von eDoc das MPG-Jahrbuch generiert wird, werden die Metadaten der MPG-Publikationen nahezu vollständig erfasst. Die Eingabe erfolgt dabei in den einzelnen Instituten, die auch die Datenhoheit für ihre Datensammlungen, sog. Collections, halten und somit bestimmen, was jeweils aufgenommen wird, sowie dafür individuelle Arbeitsabläufe geschaffen haben. Durch die Vergabe verschiedener Rollen an die Akteure wird hierbei eine inhaltliche (authority) und formale (moderator) Qualitätskontrolle der abgelegten (depositor) Datensätze gewährleistet. In Verbindung mit den bibliographischen Daten können weitere Dateien, wie etwa unterschiedliche Versionen der Volltexte, abgelegt werden. Diese Anlagen können mit einem abgestuften System von Zugriffsrechten (intern, institutsweit, MPG-weit und öffentlich) zugänglich gemacht können. Der Anteil der Datensätze mit angehängtem Volltext steigt kontinuierlich. Derzeit sind ca. 42% der abgelegten Volltexte für die Öffentlichkeit zugänglich.

Für eine größtmögliche Sichtbarkeit werden die Inhalte von den großen Suchmaschinen (wie z.B. Google) indexiert. Zusätzlich steht eine OAI-PMH-Schnittstelle für OAI-Serviceprovider (z.B. BASE, DINI OAI Search oder OAIster) zur Verfügung. Dabei sind unterschiedliche Datensätze (set-Argumente) abrufbar: nur die Metadaten, Metadaten mit Volltexten oder die speziellen Kriterien unterliegenden Publikationen für das Jahrbuch. Der Import von Daten aus Datenbanken und Literaturverwaltungssystemen wird über ein spezielles XML-Import-Schema bzw. eigene Mappings (Transformationen) von Endnote, RIS, WoS oder BibTeX ermöglicht.

Für die Pflege des Systems, inklusiver notwendiger Bug Fixes, sowie zur Schulung für den Umgang mit eDoc steht ein Support Team (seit 2007 ebenfalls in der MPDL) zur Verfügung. Dieses arbeitet eng mit den beiden Mitarbeitern der Open Access Policy-Stelle bei gemeinsamen Veranstaltungen oder bei der Erstellung umfangreicher Statistiken und Sonderabfragen von eDoc zusammen.


Eine neue Generation eines Repositoriums – PubMan

Aufbauend auf den Erfahrungen und Wünschen der Nutzer wurde eine neue Anwendung mit der Bezeichnung „Publication Management“ (PubMan; http://pubman.mpdl.mpg.de) entwickelt, welche auf dem eSciDoc Framework (http://escidoc.org) basiert. Dieses seit 2004 vom deutschen Bundesministerium für Bildung und Forschung (BMBF) geförderte Gemeinschaftsprojekt des Fachinformationszentrums Karlsruhe (FIZ Karlsruhe) und der MPG hat als Ziel, eine Kommunikations- und Publikationsplattform für virtuelle Forschungsumgebungen aufzubauen. Die entwickelten Komponenten sind allesamt Open Source und unter eine Common Development and Distribution License (CDDL) beziehungsweise Creative Commons Attribution License (CC-by) für Dritte nachnutzbar. Derzeit existieren in der eSciDoc-Umgebung neben PubMan noch zwei weitere Anwendungen für die digitale Bereitstellung und kooperative Bearbeitung wissenschaftlicher Inhalte, wie Abbildungen menschlicher Emotionen (FACES; http://www.escidoc.org/JSPWiki/en/Faces) oder historische juristische Texte (VIRR; http://www.escidoc.org/JSPWiki/en/VirtuellerRaumReichsrecht).

Sämtliche eSciDoc Anwendungen, u.a PubMan, basieren auf der service-orientierten Infrastruktur eSciDoc. Die Artefakte bzw. Inhalte, wie Images (FACES), Publikationen (PubMan) oder Digitalisate (VIRR) werden letztendlich in FEDORA (Flexible Extensible Digital Object Repository Architecture) nachhaltig gespeichert.

Das zentrale Ziel der Anwendung PubMan ist das nachhaltige Verwalten, Publizieren und Nachnutzen wissenschaftlicher Veröffentlichungen der jeweiligen Einrichtung sowie die Möglichkeit zur Verknüpfung zu Forschungsdaten und ergänzenden Materialien. Basierend auf den Erfahrungen mit der ersten Repository-Anwendung eDoc wurde bei der Konzeption von PubMan besonderes Augenmerk auf einfache, nutzerfreundliche Eingabemöglichkeiten sowie möglichst breite Nachnutzungsszenarien gelegt (Abbildung 1 [Abb. 1]).

Als Teil der eSciDoc Infrastruktur basiert PubMan vollständig auf XML, unterstützt offene Formate und Schnittstellen (z.B. REST, SRU/SRW, OAI, RSS, Open Search etc.), ist durchgängig internationalisiert und aufgrund seines modularen Aufbaus flexibel für Erweiterungen, um die Anforderung der unterschiedlichen Disziplinen an das System weitestgehend erfüllen zu können. Eine Übersicht über die Funktionalitäten der Anwendung sowie ein Link auf eine Demo-Version ist unter http://colab.mpdl.mpg.de/mediawiki/Portal:PubMan erreichbar.

Innerhalb der MPG arbeiten sechs MPIs als sogenannte Early Adopters eng mit dem Entwicklerteam der MPDL zusammen. Die Institute haben auf diese Weise einen wichtigen und vor allen Dingen praxisbezogenen Beitrag zu den mittlerweile fünf Releases von PubMan geleistet. Darüber hinaus wurde und wird eine Vielzahl von Partnern aus wissenschaftlichen Einrichtungen involviert, die durch ihre spezifischen Bedürfnisse das Spektrum zügig erweitern helfen. Derzeit besteht ein enger Austausch innerhalb Europas (z.B. CNRS/Frankreich, DANS/Niederlande, King’s College/UK) und in Japan (NIMS).

PubMan wird seit Herbst 2008 von den ersten Early Adopters (MPI für Gravitationsphysik) produktiv genutzt. Seit März 2009 nutzt das MPI für Psycholinguistik das Repositorium für seinen neuen Webseiten-Auftritt. Die wichtigsten Anforderungen des Instituts, die Einbindung der Publikationsdaten in das CMS des Instituts und die Erstellung interner Publikations- und Referenzlisten, sind prototypisch für die meisten Nachnutzungsszenarien in Wissenschaftsorganisationen: Für Evaluation durch die Fachbeiräte oder für interne Statusberichte, aber auch für persönliche Mitarbeiterseiten im Internetauftritt der einzelnen Institute werden Publikationsdaten, mit Link auf Volltexte, in bestimmten Formaten, Zitierstilen, Sortierungen und Gruppierungen benötigt (Abbildung 2 [Abb. 2]).

Zu diesem Zweck wird die Maschinen-Schnittstelle Search&Export (REST; http://pubman.mpdl.mpg.de/search/SearchAndExport_info.jsp) genutzt. Aber auch über die Nutzeroberfläche können Anwender die unterschiedlichsten Exportfunktionen für einzelne Datensätze und (sortierte) Listen als RTF, XML, ODT, PDF, HTML oder Endnote und BibTeX oder per E-Mail nutzen. Via Schnittstelle (OAI-PMH) können Daten von Dritten geharvested werden; Bookmarking Services und RSS/ATOM Feeds werden ebenfalls unterstützt. Ein Ausbau der unterstützten Zitierstile (derzeit APA und AJP) erfolgt sukzessive.

Die Eingabe der Daten in das System erfolgt entweder automatisch durch die Einspeisung der Metadaten aus externen Archiven oder Datenbanken (arXiv, BioMed Central, SPIRES, PubMed) oder über Einzel- oder Massenimport von Literaturlisten (Endnote, WoS, RIS, BibTeX). Bei der manuellen Eingabe in PubMan kann zwischen einer kurzen (Easy Submission) und einer detaillierten (Full Submission) Eingabemaske gewählt werden. Diese zeigt je nach Publikationstyp, etwa Zeitschriftenartikel oder Buchkapitel, nur die relevanten Eingabefelder an. Hier können dann auch bei der Ablage der Volltexte Angaben über deren Art (Preprint, Postprint, Supplementary Material, Table of Contents, …) sowie zur Rechte- oder Lizenzsituation gegeben werden. Die Anzahl der hochgeladenen oder verlinkten Volltexte ist hierbei unbegrenzt. Den abgelegten Dateien können abgestufte Zugriffsrechte für Dritte zugeordnet werden, die Metadaten sind immer öffentlich sichtbar. Für die Freischaltung der Datensätze können Nutzer aus zwei Workflows wählen, die eine mehr oder weniger restriktive Qualitätssicherung unterstützen.

Bei der Eingabe kann der Nutzer auf kontrolliertes Vokabular für Personen, Zeitschriftennamen und Organisationen bzw. deren Einheiten zurückgreifen; bei der Beschreibung der Inhalte kann die Dewey Decimal Classification (DDC) verwendet werden. Die Funktionalität einer Vorschlagsliste („Autosuggest“) unterstützt den Nutzer bei der Eingabe und erhöht gleichzeitig die Qualität der Daten. Die Verwendung von Autoren-IDs, erlaubt zusätzliche Komfortfunktionen wie die Generierung von personen-spezifischen „Researcher Portfolios“ – inklusive Angaben zur Person und Lebenslauf, einer kompletten und dynamisch erzeugten Literaturliste oder die Einbindung von externen Datenbanken/Systemen, wie World-Cat oder Google Scholar, zur Suche nach weiteren Werken. Eine einfache Möglichkeit der Nachnutzung ist die Verbindung zwischen PubMan als Archiv und Blog als Einstiegspunkt: Dieses Verfahren ist bei dem Open Access-Projekt der „von-Sengbusch-Kollektion“ umgesetzt worden, in welchem PubMan lediglich als Datencontainer sämtlicher Werke des verstorbenen Max-Planck-Direktors Prof. Reinhold von Sengbusch (1898–1985) funktioniert, während die tatsächliche Ausgabe über eine Schnittstelle in einen WordPress Blog (http://sengbusch.blogs.mpdl.mpg.de) erfolgt, dessen Oberfläche, Datenanordnung etc. völlig unabhängig von PubMan gestaltet wurde.

Die verteilte Bearbeitung der einzelnen Einträge in PubMan, „Items“ genannt, sowie Änderung an Metadaten und Volltexten werden von einer automatischen, durchgängigen Versionierung begleitet, wobei jede Version einzeln referenzierbar ist. Sollte eine grundlegende intellektuelle Überarbeitung einer Publikation erfolgen, können neue, eigens identifizierte Datensätze (Revisionen) angelegt werden, die über eine ontologie-basierte semantische Relation („is revision of“) die nachhaltige Beziehung zwischen den Datensätzen sicherstellen.

Ein weiterer Schritt in dieser Richtung wird die Referenzierung einzelner Textpassagen sein; diese Erweiterung für PubMan wird im Augenblick in einem Projekt mit dem MPI für evolutionäre Anthropologie adressiert. Dabei sollen linguistische Texte, insbesondere verstreute „graue Literatur“ wie Doktorarbeiten, in einer institutseigenen Sammlung abschnittsweise referenzierbar sowie intern und falls möglich auch öffentlich verfügbar gemacht werden.

Die umfangreiche Erschließung der Datensätze und beigefügten Dateien ermöglicht derzeit bereits eine Suche in den Volltexten mit unterschiedlichen Formaten (PDF, Word, Text, XML) und erlaubt darüber hinaus die Darstellung und Markierung von Fundstellen in diesen Texten.

Mit der Version 5.0 der Anwendung PubMan (Mai 2009) wird nun sukzessive in den Instituten der MPG der Umstieg auf das neue System sowie die Migration der Daten eingeleitet. Jeder Migrations- bzw. Produktivkandidat wird einzeln betreut, um besondere Migrationsdetails sowie den adäquaten Einsatz am Institut gemeinsam zu erarbeiten. Die bereits existierenden Daten in eDoc werden dafür migriert und bilden den Grundstock für die neue Sammlung des einzelnen Instituts in PubMan.

Darüber hinaus wird die Einbindung von PubMan in Netzwerke, wie etwa beim DRIVER-Projekt (http://www.driver-repository.eu), angestrebt. Interesse besteht auch an der Weiterentwicklung von Standards und Verfahren in Bezug auf Datenaustausch, Harvesting, Data Mining und interoperable Nutzungsstatistiken, so dass der Grüne Weg einen weitreichenden Beitrag auf dem Weg zur Zugänglichkeit der Forschungsergebnisse leisten kann. Diesen Weg wird die MPG daher weiterhin nachhaltig unterstützen.

Die Autoren danken Malte Dreyer und Ulla Tschida für die kritische Lektüre des Manuskripts sowie Dr. Jos van Berkum für die Bereitstellung seiner detaillierten Illustration zum Workflow am MPI für Psycholinguistik.