gms | German Medical Science

GMDS 2013: 58. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie

01. - 05.09.2013, Lübeck

PAR-Ansatz zur schematischen Darstellung von Informationsqualitätskriterien in einem Datawarehouse-Prozess

Meeting Abstract

Search Medline for

  • Tobias Rassmann - Medizinische Hochschule Hannover, Hannover, DE

GMDS 2013. 58. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS). Lübeck, 01.-05.09.2013. Düsseldorf: German Medical Science GMS Publishing House; 2013. DocAbstr.264

doi: 10.3205/13gmds139, urn:nbn:de:0183-13gmds1398

Published: August 27, 2013

© 2013 Rassmann.
This is an Open Access article distributed under the terms of the Creative Commons Attribution License (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en). You are free: to Share – to copy, distribute and transmit the work, provided the original author and source are credited.


Outline

Text

Einleitung und Fragestellung: Die MHH verfügt europaweit über eines der größten organ-übergreifenden Transplantationszentren. Um sich im internationalen Vergleich eine Spitzenposition sichern zu können und diese sukzessiv auszubauen wurde 2008 ein integriertes Forschungs- und Behandlungszentrum für Transplantationen (IFB-Tx) ins Leben gerufen. Das Ziel des IFB-Tx ist es alle grundlegenden und klinischen Forschungsbereiche der Transplantationsmedizin in einer Organisationseinheit zusammenzuführen um effektive Prozesse in den administrativ-wirtschaftlichen Bereichen und dem Forschungsbereich zu definieren und so Synergien zu erzielen. Im Rahmen der ersten Förderphase wird die Entwicklung und Einführung eines zentralen klinischen Datawarehouse (clinical datawarehouse – CDWH) gefördert. Dabei ist gerade in der Anfangsphase der Einführung einer Datawarehouse-Lösung ein besonderes Augenmerk auf die Auswahl einer geeigneten Software zu legen.Hierfür müssen softwarespezifische Informationsqualitätskriterien identifiziert werden, die sich an einem klassischen Datawarehouseprozess nach Bill Inmon orientieren.

Material und Methoden: Im Jahr 1996 haben Richard Wang und Diane Strong Kriterien zur Abbildung von Informationsqualität definiert. Diese haben Sie in Form einer Umfrage unter IT-Nutzern mit Hilfe von statistischen Methoden aus über hundert verschiedenen Attributen ausgewählt [1]. Dabei sind die fünfzehn Attribute ausgewählt worden, bei denen eine Übereinstimmung von 80% oder mehr unter den an der Umfrage teilnehmenden IT-Nutzern vorlag. Im Jahr 2007 wurde dieses Konzept im Rahmen eines Projekts der Deutschen Gesellschaft für Informations- und Datenqualität – DGIQ – zur Beschreibung der Qualität von Informationen leicht modifiziert übernommen und grafisch dargestellt [2]. Im Prozess des Aufbaus eines klinischen Datawarehouse als Informationsbasis in der klinischen Forschung müssen spezielle Anforderungen bei der Identifikation von Informationsqualitätskriterien berücksichtigt werden. Anhand eines Pilotprojekts, bei dem eine Teilmenge medizinischer Stammdaten und Forschungsdaten über einen ETL (Extraktion, Transformation, Laden) –Prozess in eine Datawarehouse-Zielarchitektur geladen worden sind habe ich die von Richard Wang definierte Menge an Informationsqualitätskriterien modifiziert und erweitert.

Ergebnisse: Unter Rücksicht auf die speziellen Anforderungen an ein Datawarehouse wurde im Rahmen meiner Arbeit ein dreidimensionales Informationsqualitätsschema (Prozesskette-Artefakt-Relativität) entwickelt. Bei diesem Ansatz werden 27 Kriterien für die Informationsqualität zu Grunde gelegt. Eingeteilt werden diese Informationsqualitätskriterien in die drei Dimensionen „Prozesskette“, „Artefakt“ und „Relativität. Die Dimension „Prozesskette“ stellt den Datawarehouseprozess als Kausalkette der drei Teilprozesse „Erschliessung“, „Verarbeitung“ und „Aufbereitung“. Die Dimension „Artefakt“bezieht sich auf die durch den Prozess generierten Objekte und ist an den Rational Unified Process angelehnt. Die Dimension „Artefakt“ gliedert sich in die Objekte „Daten“, „Metadaten“ und „Prozessarchitektur“. Die dritte Dimension „Relativität“ lässt sich in die Ausprägung „Zielbezug“ und die Ausprägung „Universalbezug“ aufteilen und zeigt auf, welche der identifizierten Informationsqualitätskriterien sich allgemeingültig zuordnen lassen und welche je nach spezieller Anforderung in Ihrer Ausprägung positiv bzw. negativ bewertet werden können. Alle in meiner Arbeit identifizierten Informationsqualitätskriterien lassen sich eindeutig in das entwickelte Informationsqualitätsschema einordnen. Eine Gewichtung der Kriterien ist zum jetzigen Zeitpunkt noch nicht umgesetzt.

Diskussion: Das entwickelte Informationsqualitätsschema soll bei der Auswahl und Entwicklung von Datawarehouse-Lösungsansätzen unterstützen und die verschiedenen zu beachtenden Dimensionen verdeutlichen. Die von mir identifizierten Informationsqualitätskriterien sollten zur Diskussion gestellt und mit vorhandenem Erfahrungswissen verglichen werden. Kritik und Verbesserungsvorschläge sind sehr willkommen.


Literatur

1.
Wang R, Strong D. Beyond accuracy; what data quality means to data consumers. Journal of Management Systems. 1996; 12: 5-34
2.
http://88.198.68.171:8080/confluence/display/homepage/Home [Internet]. Offenbach am Main; dgiq - Deutsche Gesellschaft für Informations- und Datenqualität e.V.; Informationsqualität: 15 Dimensionen, 4 Kategorien; 2007 [cited 2012 Jan 16]; Available from: http://88.198.68.171:8080/confluence/download/attachments/111411219/15.+IQ+Dimensionen.pdf? External link