gms | German Medical Science

GMS Medizin — Bibliothek — Information.

Arbeitsgemeinschaft für Medizinisches Bibliothekswesen (AGMB)

ISSN 1865-066X

EconStor: ein fachliches Repositorium für die Wirtschaftswissenschaften

EconStor: a subject-based repository for economics and business studies

Fachbeitrag

Search Medline for

  • author Timo Borst - ZBW – Deutsche Zentralbibliothek für Wirtschaftswissenschaften, Leibniz-Informationszentrum Wirtschaft, Kiel, Deutschland
  • corresponding author Jan B. Weiland - ZBW – Deutsche Zentralbibliothek für Wirtschaftswissenschaften, Leibniz-Informationszentrum Wirtschaft, Kiel, Deutschland

GMS Med Bibl Inf 2009;9(1):Doc08

doi: 10.3205/mbi000136, urn:nbn:de:0183-mbi0001367

Published: June 16, 2009

© 2009 Borst et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution License (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en). You are free: to Share – to copy, distribute and transmit the work, provided the original author and source are credited.


Zusammenfassung

Mit der Migration auf die international verbreitete Repository-Software DSpace Anfang 2009 präsentiert die „Deutsche Zentralbibliothek für Wirtschaftswissenschaften“ (ZBW) ihren Dokumentenserver mit neuem Webauftritt und unter einem neuen Namen: EconStor. Zusätzlich zu den bereits in der Vorgängeranwendung OPUS umfangreich nachgewiesenen elektronischen Arbeits- und Diskussionspapieren, überwiegend von deutschen wirtschaftswissenschaftlichen Fakultäten und Forschungsinstituten, sollen für EconStor verstärkt weitere Publikationsarten eingeworben werden, insbesondere Postprints. Im Rahmen des von der Europäischen Union (EU) geförderten Projekts „Network of European Economists Online“ (NEEO) nutzen bereits zahlreiche Forscherinnen und Forscher des Kieler Instituts für Weltwirtschaft EconStor zur Bereitstellung ihrer Publikationen nach dem Open-Access-Prinzip.

Für fachliche Repositorien ist eine Integration in die etablierten Angebote der Fachinformation von hoher Bedeutung für eine möglichst weite Verbreitung und Nutzung in der eigenen Forscher-Community. Neben der Einspielung bestimmter Arbeitspapierserien in die Fachdatenbank „Research Papers in Economics“ (RePEc) plant die ZBW, über eine Schnittstelle zur eLibrary des „Social Science Research Network“ (SSRN) einen analogen Service für dieses international ebenso renommierte Forscher-Netzwerk aufzubauen.

Grundvoraussetzung zur Realisierung der genannten Vorhaben ist ein Dokumentenmanagement-System, dass offen ist für die technischen Anpassungen, die sich aus diesen spezifischen Anforderungen ergeben. Es werden die Kriterien erläutert, die zur Auswahl von DSpace als Repository-Software geführt haben.

Schlüsselwörter: Wirtschaftswissenschaften, fachliches Repositorium, Open Access, NEEO, RePEc, SSRN, DSpace

Abstract

Since the migration to DSpace, an internationally widely used digital repository software, at the beginning of 2009, the “German National Library for Economics” (ZBW) presents its repository with a new website and a new name: EconStor.

In addition to the considerable number of working and discussion papers – predominately edited from economics faculties and research institutes in Germany and collected via its predecessor application OPUS – ZBW intends to acquire further document types, especially postprints. Numerous researchers from the Kiel Institute for the World Economy are already using EconStor for open access publishing within the framework of the EU-funded project entitled „Network of European Economists Online“ (NEEO).

It is of utmost importance for a subject-based repository to be cross-linked with the well-established databases and other resources dedicated to its subject area in order to achieve a wide dissemination and reception within its own scientific community. Besides providing metadata of several working paper series to the bibliographic database „Research Papers in Economics“ (RePEc), ZBW plans to establish a similar service for the renowned „Social Science Research Network“ (SSRN) by setting up an interface to SSRN’s eLibrary.

A basic requirement to realize these intentions is a flexible document management system which is open to the adaptations needed to fulfill these specifications. The criteria which led to the decision for DSpace as repository software will be explained.

Keywords: economics and business studies, subject repository, Open Access, NEEO, RePEc, SSRN, DSpace


Einleitung

Die Deutsche Zentralbibliothek für Wirtschaftswissenschaften (ZBW) hat bereits Anfang 2003 einen Dokumentenserver aufgesetzt, um zunächst die elektronischen Arbeits- und Diskussionspapiere wirtschaftswissenschaftlicher Forschungseinrichtungen zu speichern. Für den Einstieg in die Welt der Repositorien wählte die ZBW die nach wie vor in Deutschland am weitesten verbreitete Software OPUS – eine Entwicklung der Universitätsbibliothek Stuttgart – in der Version 2.0 [1]. Mit OPUS konnten zahlreiche, wichtige Erfahrungen in der Aufbereitung und freien Weiterverbreitung elektronischer Publikationen gesammelt werden. Insbesondere konnte bereits in OPUS eine Schnittstelle zur Fachdatenbank „Research Papers in Economics“ (RePEc) realisiert werden, über die seit Mitte 2006 die Titeldaten von einigen deutschen Arbeitspapierreihen (z.B. die Serien der Deutschen Bundesbank), Konferenzbeiträge sowie die Aufsätze des E-Journals „Economics“ an RePEc geliefert werden (vgl. http://ideas.repec.org/s/zbw/ifweej.html).

OPUS ist jedoch sehr stark zugeschnitten auf die spezifischen Bedürfnisse deutscher Universitätsbibliotheken. Die Aufgaben und Dienstleistungen der ZBW stellen jedoch weitergehende Anforderungen an die Funktionalität eines Dokumentenservers, als von den primär auf dem Gedanken des „Self-Archiving“ basierenden, institutionell ausgerichteten Repository-Lösungen standardmäßig angeboten wird. So kann die ZBW mit ihrer rein fachlichen Ausrichtung im Gegensatz zu einer Universitätsbibliothek nicht von einer festen Institutsstruktur für ihr Repositorium ausgehen. Des Weiteren werden auch die elektronischen Publikationen aus den Sammelgebieten der ZBW – insbesondere Arbeitspapier-Reihen – mit sehr gut aufbereiteten Metadaten in der Datenbank ECONIS nachgewiesen, so dass es nahe liegt, diese Metadaten über eine Import-Schnittstelle auf den Dokumentenserver zu übertragen. Dadurch entsteht zwar im Vergleich zum Self-Archiving ein deutlich höherer Aufwand bei der Metadatenerstellung auf Seiten der ZBW. Andererseits konnte die ZBW mit diesem Vorgehen bisher aber eine wesentlich größere Zahl an Dokumenten auf ihren Server übertragen als die meisten Universitätsrepositorien in Deutschland. Dieses auch als “Mediated deposit” bezeichnete Verfahren, also die weitestgehende Übernahme von Metadaten-Generierung und Volltext-Upload durch den Repository-Betreiber selbst, ist aus unserer Sicht ein sehr wichtiger Erfolgsfaktor für die Content-Akquise [2].

Wesentlich entscheidender für die strategische Ausrichtung eines Repositoriums der Wirtschaftswissenschaften ist aber die Anforderung, dass dieses Produkt kein reines „Stand-Alone“-Angebot bleiben darf, sondern dass eine (zumindest optionale) Anbindung an die in den Wirtschaftswissenschaften renommierten digitalen Fachangebote, wie insbesondere RePEc und „Social Science Research Network“ (SSRN), oder an neue, fachlich ausgerichtete Open-Access-Projekte wie das EU-Projekt „Network of European Economists Online“ (NEEO) ermöglicht wird.

Insgesamt haben die bisherigen Erfahrungen gezeigt, dass die ZBW ein flexibles Ablagesystem für wissenschaftliche Volltexte benötigt – inklusive eines flexiblen Datenbanksystems zur Verwaltung der entsprechenden Metadaten mit Im- und Exportmöglichkeiten – um den aktuellen und perspektivisch auch den zukünftigen Anforderungen gerecht werden zu können.

In diesem Beitrag wird zunächst der Content, der aktuell auf EconStor zu finden ist, kurz dargestellt. Im dritten Abschnitt werden die internationalen Fachangebote (NEEO, RePEc, SSRN) beschrieben, in die dieser Content eingespielt werden soll. Der vierte Abschnitt erläutert die Anforderungen, die aus Sicht der ZBW an eine Repository-Software zu stellen sind. In den letzten beiden Abschnitten werden wir näher auf die Software DSpace eingehen und erläutern, welche Gründe zur Wahl von DSpace als Repository-Software für EconStor geführt haben.


EconStor-Content

In der wirtschaftswissenschaftlichen Forschung spielen Arbeits- und Diskussionspapiere eine wesentliche Rolle, denn in ihnen spiegelt sich die aktuelle wissenschaftliche Diskussion wider. Arbeitspapiere sind folglich für die Forscherinnen und Forscher von besonders hoher Bedeutung, und um eine schnelle Verbreitung zu gewährleisten, erscheinen diese inzwischen nahezu vollständig elektronisch, und bis auf wenige Ausnahmen sind diese Veröffentlichungen auch frei im Internet verfügbar [3]. Wirtschaftswissenschaftliche Arbeitspapiere werden traditionell als Schriftenreihe einer Einrichtung herausgegeben und über deren Webseite publiziert. Beinahe jeder Fachbereich und jedes Forschungsinstitut veröffentlicht eine oder gar mehrere Arbeitspapierreihen.

Bisher (Stand: 15.04.2009) haben genau 100 deutsche und 18 Einrichtungen aus anderen Ländern der Speicherung ihrer Reihen auf dem ZBW-Dokumentenserver zugestimmt und die entsprechenden Nutzungsrechte der ZBW schriftlich übertragen (für eine aktuelle Übersicht siehe http://www.econstor.eu/community-list). Neben zahlreichen universitären Forschungsinstituten, Fachbereichen und Lehrstühlen befinden sich darunter

  • alle großen deutschen Wirtschaftsforschungsinstitute:
    • Institut für Weltwirtschaft (IfW, Kiel)
    • Deutsches Institut für Wirtschaftsforschung (DIW, Berlin)
    • Zentrum für Europäische Wirtschaftsforschung (ZEW, Mannheim)
    • ifo Institut für Wirtschaftsforschung (ifo, München)
    • Rheinisch-Westfälisches Institut für Wirtschaftsforschung (RWI, Essen)
    • Institut für Wirtschaftsforschung Halle (IWH)
    • Forschungsinstitut zur Zukunft der Arbeit (IZA, Bonn)
    • Institut für Arbeitsmarkt- und Berufsforschung (IAB, Nürnberg)
  • drei Max-Planck-Institute (MPI), z.B. das MPI für Ökonomik (Jena)
  • fünf Sonderforschungsbereiche, z.B. SFB 649: Ökonomisches Risiko
  • die Forschungsabteilungen von Bundesbank und Deutscher Bank

Damit vereint die ZBW den überwiegenden Teil der aktuellen deutschen Beiträge zur wirtschaftswissenschaftlichen Diskussion auf ihrem frei zugänglichen Volltext-Server. Zum jetzigen Zeitpunkt befinden sich dort über 8000 elektronische Arbeitspapiere, sie stellen den mit Abstand größten Anteil an den Publikationen auf EconStor.

Darüber hinaus enthält EconStor die Konferenzbeiträge von drei Konferenzen aus den Jahren 2005 bis 2007 des Ausschusses für Entwicklungsländer des Vereins für Socialpolitik, die Aufsätze aus „Economics – The Open-Access, Open-Assessment E-Journal“ sowie zahlreiche Postprints von Forscherinnen und Forschern des IfW, die im Rahmen des NEEO-Projekts eingeworben werden. Auf die Besonderheiten von NEEO wird unten näher eingegangen.

Die Dokumente sind aufbereitet mit den entsprechenden Metadaten, insbesondere den inhaltlich beschreibenden Metadaten JEL-Klassifikation („Journal of Economic Literature Classification System“), Autoren-Schlagwörter und Abstracts, soweit diese Daten von den Autorinnen und Autoren zur Verfügung gestellt werden. In EconStor wird das Handle-System [4] als Persistent-Identifier-System verwendet. Sämtliche Dokumente auf EconStor erhalten einen Handle-Identifier, mit dem diese dauerhaft verlinkt und referenziert werden können. Abbildung 1 [Abb. 1] zeigt im Ausschnitt die Darstellung eines vollständigen Titeldatensatzes auf EconStor in der erweiterten Anzeige im Dublin-Core-Format (vgl. auch http://www.econstor.eu/handle/10419/24883?mode=full).


Vernetzung mit internationalen Fachinformationsangeboten

Im folgenden sollen mit dem EU-Projekt NEEO ein relativ neues, und mit RePEc und SSRN zwei international etablierte Angebote in der ökonomischen Fachinformation dargestellt werden, in die der EconStor-Content (optional) integriert werden soll.

a) NEEO

Die ZBW ist seit 2007 an dem von der EU geförderten Open-Access-Projekt NEEO [5] beteiligt. Vorbild für dieses internationale Projekt ist der niederländische „Cream of Science“-Ansatz [6]. Ziel von NEEO ist es, den gesamten Publikationsoutput von Wirtschaftswissenschaftlerinnen und Wirtschaftswissenschaftlern der beteiligten Einrichtungen im Open Access verfügbar zu machen. Das Projekt wird seit September 2007 im Rahmen des EU-Programms eContentplus für die Dauer von 30 Monaten von der EU gefördert. Insgesamt sind 18 Universitäten und Wirtschaftsforschungseinrichtungen aus dem Bibliotheksnetzwerk NEREUS (Network Economic Resources for European Scholars) an NEEO beteiligt.

Das Konzept von NEEO basiert auf den institutionellen Repositorien der Partnereinrichtungen, die über ein fachliches Harvesting in einem gemeinsamen Portal zusammengeführt werden. Das Portal wird neben einer Suchoberfläche auch eine Browsing-Struktur mit vollständigen Publikationslisten der beteiligten Forscherinnen und Forscher bieten. Die ZBW arbeitet im Kontext von NEEO als Dienstleisterin für die Forscherinnen und Forscher des Instituts für Weltwirtschaft (IfW). Auf EconStor wird dabei in einer eigenen Kollektion der gesamte Publikationsoutput der beteiligten Forscherinnen und Forscher nachgewiesen. Die ZBW arbeitet aktiv mit den Autorinnen und Autoren daran, möglichst viele Publikationen im Open Access bereitzustellen. Neben den Institutspublikationen (z.B. den Kieler Arbeitspapieren), die auch rückwirkend digitalisiert und verfügbar gemacht wurden, ist die Zweitveröffentlichung von Postprints ein Schwerpunkt des Projekts. Die ZBW übernimmt dabei für die IfW-Forscherinnen und -Forscher im Rahmen eines Full-Services den überwiegenden Teil der Arbeitsschritte, einschließlich der Klärung der rechtlichen Fragen, der Anpassung von Dateiformaten und dem Einstellen der Dokumente in EconStor. Abbildung 2 [Abb. 2] zeigt die Startseite der NEEO-Kollektion auf EconStor (vgl. auch http://www.econstor.eu/handle/10419/8).

b) RePEc

RePEc hat sich mit seinen verschiedenen Diensten zum Haupeinstieg für die Suche nach frei verfügbaren wirtschaftswissenschaftlichen Arbeitspapieren entwickelt. Der Nachweis einer Arbeitspapierserie in der RePEc-Datenbank bietet enorme Vorteile, sowohl für die einzelnen Papiere als auch für die Serie insgesamt:

  • direkte Verbreitung der Papiere in der Fach-Community über die etablierten, frei zugänglichen RePEc-Services IDEAS [7] und EconPapers [8], sowie über den RePEc-Alertingdienst „New Economic Papers“ (NEP) [9]
  • hohes Ranking in der Google-Trefferanzeige für Titel aus IDEAS und EconPapers
  • detaillierte Downloadstatistiken über LogEc [10]
  • Zitationsanalyse und Einbindung in CitEc [11]
  • Einbindung der Titel in den „RePEc Author Service“ (RAS) [12]
  • ggf. Nachweis in EconLit, der weltweit renommiertesten bibliographischen Datenbank für die Wirtschaftswissenschaften, herausgegeben von der American Economic Association (AEA). In Kooperation mit RePEc werden von der AEA ausgewählte Serien in EconLit übernommen [13].

Bei der Einwerbung bibliographischer Daten, also auf der Input-Seite der RePEc-Datenbank, richtet sich RePEc ausdrücklich an Institutionen. Für den Self-Upload von Titeln durch einzelne Autorinnen und Autoren steht dagegen das „Munich Personal RePEc Archive (MPRA)“ [14] zur Verfügung. MPRA basiert auf der Software EPrints 3.0 und stellt damit neben EconStor ein weiteres ökonomisches Fach-Repositorium dar.

Mit seinem dezentralen Ansatz agiert RePEc quasi als „fachliche Registry“ für Arbeitspapierserien aus den Wirtschaftswissenschaften: Die interessierten Einrichtungen melden sich selbst bei RePEc an und sorgen auch selbst für die Aufbereitung und Bereitstellung der Metadaten (und ggf. des Volltexts) jedes einzelnen Titels. Eine Einrichtung stellt dazu auf einem eigenen Server (= RePEc-Archiv) die entsprechenden Metadaten im RePEc-Format ReDIF [15] online zur Verfügung. Derzeit gibt es über 1000 Archive mit insgesamt mehr als 2500 Serien. RePEc harvestet entsprechend dem Guildford Protocol [16] täglich die einzelnen Server und aktualisiert die Datenbank, die durch die Services IDEAS und EconPapers jeweils im vollen Umfang bereitgestellt wird.

Die Metadaten der Arbeitspapiere werden also dezentral in einzelnen Archiven von den herausgebenden Einrichtungen selbst gepflegt und zentral in der RePEc-Datenbank nachgewiesen. Damit ist das RePEc-Modell vergleichbar mit dem Modell der Open Archive Initiative (OAI): Die Archive entsprechen den sogenannten OAI-Data-Providern, und IDEAS oder EconPapers stellen diverse Services zur Verfügung, entsprechen also den sogenannten OAI-Service-Providern. Und tatsächlich diente das Guildford Protocol auch als ein Vorbild für das OAI-Protocol for Metadata Harvesting (OAI-PMH) [17]. Damit ist RePEc ausdrücklich kein (fachliches) Repositorium oder Preprint-Server für die Wirtschaftswissenschaften, wie in diesem Zusammenhang vielfach fälschlich behauptet wird, wie z. B. im „Ranking Web of World Repositories“, in dem RePEc noch immer auf Platz vier in der Liste der 300 besten Repositorien steht [18]. RePEc ist vielmehr – im besten OAI-Sinne – ein fachlicher Service-Provider.

Das Ziel der ZBW ist es, EconStor zu einem nationalen Inputservice für RePEc auszubauen, um wesentlich mehr Arbeitspapierreihen über diesen Vertriebsweg international sichtbarer zu machen und um letztlich die Rezeption dieser Fachbeiträge deutlich zu verbessern.

c) SSRN

Neben RePEc bietet SSRN die bekannteste frei zugängliche Datenbank für wirtschafts- und sozialwissenschaftliche Arbeiten. Im Gegensatz zu RePEc orientiert sich SSRN wesentlich stärker an den einzelnen Autorinnen und Autoren. Und während RePEc eine reine Nachweisdatenbank mit Volltext-Verlinkung auf die jeweiligen Institutsserver anbietet, werden bei SSRN die Volltexte überwiegend von den einzelnen Autorinnen und Autoren selbst kostenlos hochgeladen und über SSRN-eigene Server weiterverbreitet. So ist es nicht verwunderlich, dass die SSRN-Beteiligung generell sehr am Engagement der einzelnen Forscherinnen und Forscher hängt.

Daneben bietet SSRN aber interessierten Einrichtungen auch die Möglichkeit, über einen zentralen Dienst deren Arbeitspapierserien vollständig in SSRN einzubringen, die dann im sogenannten „Partners in Publishing“-Programm [19] gesondert aufgelistet werden. Dieses zusätzliche SSRN-Angebot ist allerdings im Gegensatz zum einfachen Autoren-Upload kostenpflichtig und ist, vermutlich auch aufgrund der Kosten, in Deutschland noch wenig verbreitet. So nutzen derzeit lediglich sieben deutsche Einrichtungen diesen Service, u.a. ifo, DIW, IZA und ZEW.

Analog zum RePEc-Service plant die ZBW auch für SSRN den Aufbau eines – in diesem Fall allerdings kostenpflichtigen – Input-Services, um auch über dieses international bedeutende Forschungsnetzwerk eine optimale Verbreitung deutscher Forschungsleistungen zu gewährleisten. Um die Kosten für die beteiligten Einrichtungen zu senken, strebt die ZBW Verhandlungen mit SSRN an, mit dem Ziel der Bildung eines nationalen Konsortiums.


Anforderungen der ZBW an die Repository-Software

An dieser Stelle sollen drei zentrale Anforderungen aus Sicht der ZBW dargestellt werden, die sich u.a. aus den Erfahrungen mit dem Einsatz der OPUS-Software ergeben haben. Auf Standard-Anforderungen an eine Repository-Lösung, wie z.B. flexible Funktionalitäten zur Unterstützung der Selbstarchivierung, aktuelle Personalisierungsfunktionen oder ein aussagekräftiges Statistikmodul wird hingegen nicht eingegangen.

a) Trennung von Metadaten und Volltext

Ein gravierender Nachteil der OPUS-Version 2.0 war die zwingende Bindung eines Metadatensatzes an den entsprechenden Volltext. Das Löschen eines Volltextes bedeutete immer zugleich das Löschen des Metadatensatzes. Gerade im Bereich der Arbeitspapiere, die sich ja ausdrücklich dadurch auszeichnen, dass sie „Work in Progress“ darstellen, kommt es häufig zu Revisionen eines Titels. In einigen Fällen wünschen die Autorinnen und Autoren dann, dass ausschließlich die aktuellste Version ihres Papiers im Internet angeboten wird. Solche Löschanfragen bedeuteten für uns zugleich den Verlust des Nachweises, obwohl dieser allein aus dokumentarischen Gründen erhalten bleiben sollte, um belegen zu können, dass dieser Titel unter einem eventuell bereits zitierten Link tatsächlich einmal vorhanden war.

Auch hinsichtlich des bereits in OPUS implementierten RePEc-Dienstes ist dies ein sehr ärgerlicher Umstand. Betrifft nämlich eine solche Löschanfrage einen Titel, der in die RePEc-Datenbank eingespielt wurde, verschwindet mit dem OPUS-Nachweis zugleich der entsprechende RePEc-Nachweis, obwohl RePEc als bibliographische Datenbank selbstverständlich reine Titelnachweise zulässt. Mit dem RePEc-Eintrag gehen dann leider auch sämtliche Informationen rund um diesen Titel verloren, wie beispielsweise die Zugriffsstatistik oder die Zitationsanalyse.

Besonders wichtig ist die Anforderung an eine getrennte Behandlung von Metadaten und Volltext im Hinblick auf die NEEO-Beteiligung der ZBW. Da in NEEO möglichst vollständige Publikationslisten der beteiligten Forscherinnen und Forscher angeboten werden sollen, ist es unumgänglich, dass das Repositorium, über das die Daten an NEEO geliefert werden, auch über die Option verfügt, reine Metadatennachweise bereitzuhalten, da nicht zu jedem Titel unmittelbar auch ein Volltext vorhanden sein wird.

b) Importschnittstelle

Eine zweite entscheidende Anforderung ist das Vorhandensein einer Schnittstelle zum massenhaften Import von Metadaten aus anderen verfügbaren Datenquellen. Hier ist an erster Stelle die ZBW-eigene Datenbank ECONIS zu nennen, in der zum einen die Titel aus Arbeitspapierreihen umfangreich nachgewiesen werden. Zum anderen enthält ECONIS fast vollständig sämtliche Titelnachweise von Publikationen der am NEEO-Projekt beteiligten IfW-Forscherinnen und -Forscher. Auch für die Migration der mehr als 7000 OPUS-Daten bietet eine Import-Möglichkeit enorme Vorteile, insbesondere hinsichtlich der Notwendigkeit, später externe Zugriffe auf OPUS-Titel direkt auf die entsprechenden EconStor-Titel umzuleiten.

EconStor wird auch in Zukunft überwiegend für die Zweitverwertung von Publikationen genutzt werden. Die entsprechenden Titeldaten sind demnach bereits in irgendeiner Form elektronisch verfügbar. Die Option, die in externen Datenquellen – sei es nun eine MySQL-Datenbank oder auch nur eine Excel-Tabelle – gut aufbereiteten Metadaten nachzunutzen, ist damit sehr von Vorteil.

c) Einbindung in externe Dienste

Als dritte zentrale Anforderung an die zukünftige Repository-Software der ZBW ist die Option zu nennen, EconStor in existierende (und perspektivisch auch in neue) Dienste der Fachinformation einbinden zu können. Diese Dienste stellen aber in den meisten Fällen ihre eigenen spezifischen Anforderungen, insbesondere in Bezug auf die zu erfassenden bzw. zu liefernden Metadaten. Ein sehr gutes Beispiel ist in diesem Zusammenhang das NEEO-Projekt, für das die bibliographischen Daten äußerst feingranular bereitgestellt werden müssen. Die Granularität des anzuwendenden Metadatenschemas geht dabei deutlich über das übliche „Qualified Dublin Core“-Format hinaus. Als Beispiel sei hier der „Digital Author Idenifier“ (DAI) genannt, der jede NEEO-Autorin und jeden -Autor eindeutig identifiziert und in den Metadaten zwingend mitgeliefert werden muss. Die ZBW verwendet als DAI die Nummer aus der standardisierten Personennamendatei (PND). Und auch für den geplanten SSRN-Dienst sind deutlich mehr Autoren-Informationen zu liefern, wie z.B. die institutionelle Zugehörigkeit der Forscherin oder des Forschers („Affiliation“) und die entsprechende E-Mail-Adresse.


Entscheidungskriterien für die Auswahl von DSpace als Repository-Software

a) Allgemein-strategische Erwägungen

Mit der Entscheidung für DSpace folgten wir zunächst nur einem allgemeinen Trend: Das am „Massachusetts Institute of Technology“ (MIT) gemeinsam mit Hewlett Packard (HP) entwickelte System ist die international am meisten eingesetzte Software für die Entwicklung und den Betrieb von Dokumentenservern, wie anhand der Statistik „Usage of Open Access Repository Software – Worldwide“ aus OpenDOAR [20] ersichtlich wird: DSpace hält demnach weltweit einen Anteil von 29% an den dort gemeldeten Installationen, mit deutlichem Abstand vor EPrints, des mit 18% am zweithäufigsten verwendeten Systems (Stand: 15.04.09). „Verbreitung“ bedeutet zwar nicht per se „Güte“, aber die relativ hohe Anzahl an lauffähigen DSpace-Installationen lässt auf die prinzipielle Tauglichkeit und Wartbarkeit der Anwendung schließen. Im produktiven Einsatz befindliche Repositorien beispielsweise auf der Basis von Fedora bedeuten national und international demgegenüber die Ausnahme.

Obwohl OPUS auf nationaler Ebene mit ca. 60 Installationen die wohl meistgenutzte Repository-Software ist, gibt es mittlerweile auch in Deutschland mehrere DSpace-Repositorien, sowie Ansätze zu einer entsprechenden Entwicklergemeinschaft [21]. Die Installationen zeigen, dass DSpace zur Publikation und Verwaltung verschiedenster Dokumenttypen (Volltexte, Bilder, Primärdaten und Lernmaterialien) verwendet wird. Gleichwohl besteht der vorrangige Einsatzzweck von DSpace darin, als Publikationsserver für wissenschaftliche Artikel und Monographien zu dienen. Hier schien uns DSpace gegenüber EPrints und OPUS, vor allem aber auch gegenüber Fedora die weitestgehende Unterstützung zu bieten.

Ein weiterer strategischer Gesichtspunkt war, dass DSpace im Rahmen des EU-Projekts NEEO [5] quasi als Referenzsystem fungiert. In diesem Zusammenhang wurden Kernfunktionen eines Repositoriums als „Data Provider“ (für Metadaten, Volltexte und Nutzungsdaten) erstmalig und beispielhaft implementiert. Vor diesem Hintergrund hätte die Entscheidung für eine andere Software bedeutet, wesentliche Entwicklungen im Alleingang durchzuführen.

b) Funktionale Kriterien

Hinsichtlich der oben genannten Anforderungsmerkmale sind wir so vorgegangen, dass wir anhand der Testinstallation beispielhafte Nutzungsszenarien durchgespielt und dabei das System auf seine funktionalen Eigenschaften überprüft haben.

DSpace bietet als Grundfunktion die Möglichkeit, bei Vorliegen entsprechender Rechte Volltexte hochzuladen und beschreibende Metadaten einzugeben. Im Standard-Einreichungsverfahren konnten allerdings keine Metadaten angelegt werden, ohne ein dazugehöriges Dokument in das System zu laden, d.h. einen sog. „Bitstream“ zu erzeugen. Andererseits zeigte sich, dass die Importschnittstelle von DSpace (der sog. „Importer“) die Möglichkeit bietet, reine Metadaten-Nachweise (sog. „Items“) ohne dazugehörige Volltexte in das System zu importieren. Da solche Nachweise im Kontext der ZBW originär nicht auf dem Dokumentenserver, sondern im lokalen Bibliothekssystem erfasst werden, können durch inkrementelle Importvorgänge die Nachweise auf dem Dokumentenserver aktuell gehalten werden, auch wenn der dazugehörige Volltext (noch) nicht zur Verfügung steht. Darüber hinaus erfüllte der Importer eine wichtige Funktion bei der Migration des Altbestandes aus dem ehemaligen OPUS-System.

Unter dem Gesichtspunkt der Personalisierung des Angebots sowie der Nutzung damit verbundener Dienste bietet DSpace mit einem eigenen geschützten Bereich („MyDSpace“) die Möglichkeit, E-Mail-Abonnements zu verwalten sowie – bei Vorliegen entsprechender Rechte und Aktionen – den Status der eigenen eingereichten Publikationen als „angenommen“ oder „abgelehnt“ (ggf. mit Begründung und Hinweisen) anzuzeigen. Auf diese Weise unterstützt DSpace die internetbasierte Organisation von Begutachtungen in rudimentärer Form, ohne freilich die Komplexität und den Komfort hierauf spezialisierter Anwendungen wie z.B. des „Open Journal System“ (OJS) [22] zu erreichen. Ansonsten deckte der persönliche Bereich mit der Möglichkeit zu E-Mail-Abonnements schon die wesentliche Anforderung ab, während die RSS-Funktionalität auch unangemeldeten Nutzerinnen und Nutzern zur Verfügung steht.

DSpace bietet standardmäßig ein Statistikmodul, welches übergreifend u.a. über die am häufigsten geklickten Nachweise (nicht Volltexte) sowie über die häufigsten Aktionen informiert. Erst auf der Basis des von der Universität Minho erstellten Statistik-Moduls [23] bieten sich hier weitergehende Möglichkeiten, wie z.B. die Logfile-Informationen dokumentbezogen auszuwerten und anzuzeigen.

c) Nicht-funktionale Kriterien

Zu diesen Kriterien zählten für uns im Vorfeld neben der allgemeinen Verbreitung der Software ihre Anpassbarkeit, die verwendete Programmiersprache, die Transparenz und Dokumentation des Quellcodes, das Verhalten bei auch mehrfachen Installationen, die Unterstützung durch eine – zumindest virtuelle – „Community“ sowie allgemeine betriebliche Voraussetzungen.

Unter dem Gesichtspunkt der Anpassbarkeit erwies sich die Software mit einer – allerdings gravierenden – Ausnahme beim Datenmodell (s.u.) als flexibel genug, um die funktionalen Anforderungen mit systemischen Mitteln umzusetzen. Durch die Entwicklung in JAVA wurde DSpace äußerlich konsequent objektorientiert programmiert, wobei von entsprechenden Konzepten wie Kapselung, Vererbung und Entwurfsmustern nach unserem Eindruck nicht immer stringent Gebrauch gemacht wurde. Hervorzuheben ist die prinzipielle Lesbarkeit des Quellcodes, aus heutiger Sicht kritisch anzumerken die Verwendung von JSP zur Generierung von HTML-Seiten: Rein programmiertechnisch und betrieblich erschwert dies die Erzeugung selbst einfacher statischer HTML-Seiten, wie sie mit Content-Management-Systemen mittlerweile problemlos auch durch nicht-technisches Personal zur Laufzeit erstellt werden können. Hinsichtlich der Installierbarkeit ist anzumerken, dass sich DSpace als einziges der evaluierten Systeme der Dokumentation folgend sowohl unter Linux als auch unter Windows auf Anhieb fehlerfrei installieren ließ.

Die DSpace-Entwicklergemeinschaft ist vor allem auf internationaler Ebene gut ausgebildet und verfügt mit einem eigenen Wiki [24], Newsletter, diversen Blogs [25] sowie z.B. jährlich im Rahmen der „Open Repositories“ [26] durchgeführten Anwendertreffen über die entsprechenden Mechanismen. In ähnlicher Form ausgebildet sein dürfte lediglich die angelsächsische EPrints-Gemeinschaft, wobei es hier wiederum – abgesehen von den Entwicklungen rund um MPRA [14] – an Betreibern aus dem deutschsprachigen Raum bisher mangelt.

Zu den positiv hervorzuhebenden, allgemeinen betrieblichen Merkmalen schließlich zählt, dass DSpace als einziges der drei evaluierten Systeme auch unter einem Windows-Server betrieben werden kann und sich damit aus der Sicht von Rechenzentren und sonstigen EDV-Dienstleistern in die jeweils bevorzugten Systemlandschaften integrieren lässt. Aus Entwicklersicht ist allerdings nach unserer Einschätzung eine Linux-Umgebung eindeutig zu bevorzugen.


Entwicklungsschritte und Erfahrungen mit dem Einsatz des Systems

a) Installation und Konfiguration

Auch die mehrfache Installation von DSpace unter verschiedenen (auch virtuellen) Betriebssystemen (Windows 2003 Server, CentOS) gestaltet sich problemlos. Als hilfreich erwiesen haben sich – neben der „offiziellen“ DSpace-Dokumentation – Erfahrungsberichte und Hinweise von anderen Einrichtungen [27]. Grundsätzlich empfiehlt es sich, die für die Systemkonfiguration maßgebliche Konfigurationsdatei [dspace-dir]/config/dspace.cfg genau zu studieren und ggf. anzupassen.

b) Anpassungen und Erweiterungen

Als Beispiel für eine wohl typische Anpassung sei die Generierung der Eingabemasken hinsichtlich Sprache und Reihenfolge der Felder angeführt. DSpace erzeugt aus allen Einträgen in der sog. „Metadaten-Registry“ bzw. aus der Konfigurationsdatei für die Eingabefelder ([dspace-dir]/config/input-forms.xml) die Eingabeformulare als JSP-Seiten. Hier erfolgt auch die Festlegung der Reihenfolge der Felder, ihre Benennung und Beschreibung sowie die Angabe, ob es sich um ein Pflichtfeld handelt. Gerade für deutschsprachige Autorinnen und Autoren könnte die Standardkonfiguration jedoch unbefriedigend sein, da hier erstens nur die englischsprachigen Benennungen und Beschreibungen geboten werden und zweitens die vorgegebene Reihenfolge dazu führt, dass sich die Autorin oder der Autor durch verschiedene Seiten blättern muss, um zu dem für ihn relevanten Eingabefeld zu gelangen. Es bot sich daher an, die Eingabefelder dahingehend umzusortieren, dass die für Autorinnen und Autoren relevanten bzw. die Pflichtfelder auf den ersten beiden Formularseiten erscheinen, während die dahinter liegenden Angaben entweder offen gelassen oder durch Bibliothekspersonal nachträglich ergänzt werden können. Hinsichtlich der Sprachumstellung wurden die Bezeichnungen und Beschreibungen der Felder ins Deutsche übersetzt und entsprechend eingetragen.

Die wesentlichste Erweiterung des Systems bestand hingegen in der Einführung sog. „Subfields“ zur Erzeugung feingranularer Metadaten. Die Motivation hierfür sei am Beispiel des im bibliothekarischen Umfeld vertrauten Metadatums für die Zitation erläutert. Dieses Metadatum enthält in aller Regel verschiedene Angaben zu einer Publikation wie (bei Herkunft aus einem Sammelwerk oder einer Zeitschrift) Herausgeberin oder Herausgeber, Erscheinungsort, Heftnummer, Seitenangaben, ISSN etc. Aus diesen Informationen können entweder in der Repository-Anwendung selbst oder in anderen Portalen mit übergreifenden Suchdiensten weitergehende Suchfunktionen erzeugt werden, wie etwa Facetten („Andere Artikel zum selben Heft“ oder „Andere Sammelwerke vom selben Herausgeber“) oder auch ein OpenURL-Dienst [28]. Allerdings setzt dies neben einer entsprechenden Metadatenerfassung voraus, dass diese Informationen in einer für Suchmaschinen bzw. OpenURL-Dienste verwertbaren Form vorliegen, also in Unterfeldern etwa des Elements identifier.citation.

DSpace sieht in seinem Datenmodell diesbezüglich keine feingranularen Metadaten vor. Es wird lediglich ein relativ flaches Schema [element].[qualifier] unterstützt und die Metadaten werden in einer Gesamttabelle (metadatavalue) verwaltet. Zwar können beliebig viele Metadaten und -schemata über die Metadaten-Registry definiert, jedoch keine Hierarchien innerhalb von Metadaten gebildet werden. Somit ist es nicht möglich, innerhalb eines Elements weitere Unterelemente und hierauf weitere Unterelemente ad inf. zu definieren. Diese – relativ fundamentale – Beschränkung wurde mit der Einführung von sog. „Subfields“ behoben – eine Mimik, die unseres Wissens zum ersten Mal von der Freien Universität Brüssel im Kontext von DSpace eingeführt wurde [29], ursprünglich aber bereits in der XML-Spezifikation von MARC21 angelegt ist [30]. Die Notation besteht darin, für jedes Subfield eine eindeutige Kodierung in Verbindung mit einem Trennzeichen einzuführen. Entsprechend stellt sich das Metadatum identifier.citation in unserer Notation beispielsweise wie folgt dar:

identifier.citation=|aJournal of institutional and theoretical economics|s0044-2550|v142|y1986|h1|p156-162

Aus den Unterfeldern können im Anschluss die Parameter für eine (fiktive) OpenURL-Anfrage generiert werden:

http://sfxserver.uni.edu/sfxmenu?issn=0044-2550&date=1986&volume=142&issue=1&spage=156

Abschließend sei bemerkt, dass es sich bei der beschriebenen Notation für Unterfelder nur um eine anwendungsinterne Darstellung handelt, die für die Weiterverarbeitung (Anzeige im Browser, Indizierung durch die Suchmaschine) aufbereitet bzw. unterdrückt werden muss.


Fazit

Anders als institutionelle Repositorien z.B. von Universitäten, die ausschließlich für die Veröffentlichungen ihrer Forscherinnen und Forscher zur Verfügung stehen, agiert die ZBW mit EconStor als fachlicher Content-Aggregator wirtschaftswissenschaftlicher Volltexte. Mit dem Angebot eines „Full-Services“ beispielsweise für die Erfassung vollständiger Arbeitspapierserien, also der Übernahme von PDF-Upload und Aufbereitung aller dazu gehörenden Titeldaten, entsteht zwar im Vergleich zum „Self-Archiving“ ein höherer Aufwand für die ZBW. Andererseits konnte die ZBW mit diesem Vorgehen bisher aber eine wesentlich größere Zahl an Dokumenten auf Ihren Server übertragen als die meisten Universitätsserver in Deutschland.

Mit der Wahl von DSpace als Repository-Software hat die ZBW die technischen Voraussetzungen dafür geschaffen, dass die auf ihrem Dokumentenserver sehr gut aufbereiteten wirtschaftswissenschaftlichen Publikationen in wichtigen Fach-Datenbanken nachgewiesen werden können und damit eine möglichst weite und nachhaltige Nutzung und Verbreitung in den Fachkreisen finden. Die ZBW übernimmt damit eine wichtige Funktion als Infrastrukturdienstleisterin für die Wirtschaftswissenschaften, insbesondere für solche Einrichtungen, die sich bisher den Aufwand einer Aufbereitung ihrer Veröffentlichungen für RePEc oder SSRN technisch oder organisatorisch nicht leisten konnten.


Literatur

1.
OPUS-Software [homepage on the Internet]. Stuttgart: Universität Stuttgart; [updated 2009 Mar 31, cited 2009 May 13]. Available from: http://elib.uni-stuttgart.de/opus/doku/opus_sw.php External link
2.
Royster P. How to Fill Your Institutional Repository: Or, Practical Lessons I Learned by Doing; Conference presentation presented at the American Library Association Convention [homepage on the Internet]. Anaheim, California: American Library Association; 2008 Jun 30 [cited 2009 May 13]. Available from: http://digitalcommons.unl.edu/library_talks/40/ External link
3.
Bergstrom T, Lavaty R. How often do economists self-archive? [homepage on the Internet]. Santa Barbara: Department of Economics, UCSB; 2007 Feb 8 [cited 2009 May 13]. Available from: http://repositories.cdlib.org/ucsbecon/bergstrom/2007a External link
4.
HANDLE.NET – The Handle System [homepage on the Internet]. Reston, Virginia: Corporation for National Research Initiatives; c2008 [updated 2009 Apr 29; cited 2009 May 13]. Available from: http://www.handle.net/ External link
5.
Economists Online Version 2.0; powered by the NEEO Project [homepage on the Internet]. Tilburg: Tilburg University. [cited 2009 May 13]. Available from: http://www.neeoproject.eu/ External link
6.
More about NARCIS, DARE and Cream of Science [homepage on the Internet]. Amsterdam: Koninklijke Nederlandse Akademie van Wetenschappen (KNAW); [updated 2008 Mar 7; cited 2009 May 13]. Available from: http://www.onderzoekinformatie.nl/en/oi/nod/keur/dare/ External link
7.
IDEAS: Economics and Finance Research [homepage on the Internet]. Storrs, Connecticut: College of Liberal Arts and Sciences, University of Connecticut; [cited 2009 May 13]. Available from: http://ideas.repec.org/ External link
8.
EconPapers [homepage on the Internet]. Örebro: Swedish Business School at Örebro University; [updated 2009 May 10; cited 2009 May 13]. Available from: http://econpapers.repec.org/ External link
9.
NEP: New Economics Papers [homepage on the Internet]. Oswego, New York: SUNY Oswego, State University of New York; [updated 2009 May 8; cited 2009 May 13]. Available from: http://nep.repec.org/ External link
10.
LogEc: Access Statistics for Participating RePEc Services [homepage on the Internet]. Örebro: Swedish Business School at Örebro University; [updated 2009 May 5; cited 2009 May 13]. Available from: http://logec.repec.org/ External link
11.
Barrueco JM. Citations in Economics [homepage on the Internet]. c2009 [updated 2009 May 5; cited 2009 May 13]. Available from: http://citec.repec.org/ External link
12.
RePEc Author Service [homepage on the Internet]. Storrs, Connecticut: College of Liberal Arts and Sciences, University of Connecticut; [cited 2009 May 13]. Available from: http://authors.repec.org/ External link
13.
EconLit Document Types: Working Papers in Economics [homepage on the Internet]. American Economic Association; c2009 [cited 2009 May 13]. Available from: http://www.aeaweb.org/econlit/doctypes.php#WPE External link
14.
Munich Personal RePEc Archive [homepage on the Internet]. Munich: Munich University Library; [cited 2009 May 13]. Available from: http://mpra.repec.org/ External link
15.
Krichel T. ReDIF version 1 specification; Revision of 2007 Jun 1 [homepage on the Internet]. [cited 2009 May 13]. Available from: http://openlib.org/acmes/root/docu/redif_1.html External link
16.
Krichel T. Guildford Protocol [homepage on the Internet]. [cited 2009 May 13]. Available from: http://openlib.org/acmes/root/docu/guilp.html External link
17.
Krichel T, Zimmermann C. The Economics of Open Bibliographic Data Provision. Economic Analysis and Policy (EAP). 2009;39(1):143-52. Available from: http://eap-journal.com/download.php?file=686 [cited 2009 May 13] External link
18.
Ranking Web of World Repositories: Top 300 Repositories; January 09 [homepage on the Internet]. Madrid: Centro de Ciencias Humanas y Sociales; c2002-2009 [cited 2009 May 13]. Available from: http://repositories.webometrics.info/top300_rep.asp External link
19.
Social Science Research Network: Browse SSRN's Partners in Publishing [homepage on the Internet]. Rochester, New York: Social Science Electronic Publishing; c2009 [cited 2009 May 13]. Available from: http://papers.ssrn.com/sol3/DisplayPipPublishers.cfm External link
20.
OpenDOAR Chart – Usage of Open Access Repository Software – Worldwide [homepage on the Internet]. Nottingham, UK: University of Nottingham; c2009 [updated 2009 May 13; cited 2009 Apr 15]. Available from: http://www.opendoar.org/onechart.php?cID=&ctID=&rtID=&clID=&lID=&potID=&rSoftWareName=&search=&groupby=r.rSoftWareName&orderby=Tally%20DESC&charttype=pie&width=600&height=300&caption=Usage%20of%20Open%20Access%20Repository%20Software%20-%20Worldwide External link
21.
Eldorado. DSpace Workshop, 14.-15. März 2007 in Kassel. Dortmund: Technische Universität [cited 2009 May 13]. Available from: https://eldorado.tu-dortmund.de/handle/2003/24178 External link
22.
Open Journal Systems [homepage on the Internet]. Public Knowledge Project [cited 2009 May 13]. Available from: http://pkp.sfu.ca/?q=ojs External link
23.
Rodrigues E, Miranda Â. Development of usage statistics for RepositóriUM [homepage on the Internet]. Minho: Universidade do Minho; c2009. [cited 2009 May 13]. Available from: http://hdl.handle.net/1822/4803 External link
24.
DSpace Wiki [homepage on the Internet]. Massachusetts: DSpace Foundation [cited 2009 May 13]. Available from: http://wiki.dspace.org/index.php/Main_Page External link
25.
Stuart Lewis' Blog dspace [homepage on the Internet]. [cited 2009 May 13]. Available from: http://blog.stuartlewis.com/tag/dspace/ External link
26.
Open Repositories [homepage on the Internet]. Open Repositories.org; c2007 [cited 2009 May 13]. Available from: http://www.openrepositories.org/ External link
27.
DSpace Installation Documentation for Edinburgh University Library [homepage on the Internet]. Edinburgh: Edinburgh University; 2003 Jul 29 [cited 2009 May 13]. Available from: http://www.thesesalive.ac.uk/archive/DSpaceInstall.html External link
28.
OpenURL [homepage on the Internet]. Dublin: OCLC; c2009 [cited 2009 May 13]. Available from: http://www.oclc.org/research/projects/openurl/default.htm External link
29.
Pauwels B. DISpace – Institutional repository @ ULB [homepage on the Internet]. Université Libre de Bruxelles: Bruxelles; 2006 Feb 12 [cited 2009 May 13]. Available from: http://bib3.ulb.ac.be/RDIB/DISpace/DIfusion%201.4.2/Internal%20record%20structure/Subfields.html External link
30.
Schema MARC21slim.xsd [homepage on the Internet]. Washington, DC: Library of Congress; [cited 2009 May 13]. Available from: http://www.loc.gov/standards/marcxml/xml/spy/spy.html External link