gms | German Medical Science

GMDS 2014: 59. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie

07. - 10.09.2014, Göttingen

Das GANI_MED Metadaten-Modell – Ein adaptives Modell zur Abdeckung breitgefächerter benutzerabhängiger Anforderungen

Meeting Abstract

  • R. Gött - Universitätsmedizin Greifswald K.d.ö.R., Institut für Community Medicine, Greifswald
  • T. Bahls - Universitätsmedizin Greifswald K.d.ö.R., Institut für Community Medicine, Greifswald
  • L. Geidel - Universitätsmedizin Greifswald K.d.ö.R., Institut für Community Medicine, Greifswald
  • J. Piegsa - Universitätsmedizin Greifswald K.d.ö.R., Institut für Community Medicine, Greifswald
  • W. Hoffmann - Universitätsmedizin Greifswald K.d.ö.R., Institut für Community Medicine, Greifswald

GMDS 2014. 59. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS). Göttingen, 07.-10.09.2014. Düsseldorf: German Medical Science GMS Publishing House; 2014. DocAbstr. 224

doi: 10.3205/14gmds122, urn:nbn:de:0183-14gmds1225

Veröffentlicht: 4. September 2014

© 2014 Gött et al.
Dieser Artikel ist ein Open Access-Artikel und steht unter den Creative Commons Lizenzbedingungen (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.de). Er darf vervielfältigt, verbreitet und öffentlich zugänglich gemacht werden, vorausgesetzt dass Autor und Quelle genannt werden.


Gliederung

Text

Einleitung und Fragestellung: Die Qualität und Aussagekraft von erfassten Daten in epidemiologischen Studien werden wesentlich durch ihre Metadaten beeinflusst. Metadaten beschreiben die Messdaten, modellieren die Semantik und den Messkontext. Zum Beispiel ist die Messung des Glucose-Anteils wertlos, wenn nicht bekannt ist, ob er im Urin oder im Blut gemessen wurde.

Im Projekt „Greifswald Approach to Individualized Medicine“ [1] werden an der Universitätsmedizin Greifswald medizinische Daten aus dem Versorgungskontext und aus speziellen Studienuntersuchungen in einer Forschungsdatenbank integriert. Diese Daten umfassen sowohl mittels elektronischer Formulare (eCRF) erfasste Anamnese-Daten als auch von diagnostischen Geräten und Laborsystemen erhobene medizinische Daten. Die integrierten Daten werden auf der Basis eines transparenten use&access-Verfahrens für die Beantwortung von Forschungsfragen bereitgestellt.

Durch die inhomogenen Eigenschaften von Datenpunkten verschiedenster Quellsysteme (z.B. Laborsystemen im Vergleich zu elektronischen Formularen), die Notwendigkeit der Zusammenfassung in ein einheitliches Metadatenmodell und die Forderung nach freien Hierarchietiefen sind übliche Methoden, wie CDISC ODM [2] oder ISO 11179v3 [3] zur Abbildung dieser Metadaten ungeeignet.

Zusätzlich haben Arbeitsbereiche, die mit Metadaten arbeiten, wie z. B. die Qualitätssicherung, die Transferstelle, auswertende Forscher, sehr unterschiedliche Sichten und Anforderungen an die Metainformationen, die sie für ihre Arbeit benötigen. Häufig kommen im Verlauf weitere Eigenschaften zu einem Datenpunkt hinzu. Die Frage ist daher, wie sich diese Anforderungen so miteinander vereinbaren und in einem Repository umsetzen lassen, dass dabei eine flexible Erweiterbarkeit der Metadatenbeschreibung gewährleistet wird.

Zielsetzung für ein solches Repository für Metadaten war es, einen möglichst generischen und wiederverwendbaren Ansatz zu entwickeln, der über den Anspruch einer lokalen und temporären Insellösung hinausgeht.

Material und Methoden: Es wurde ein Object-Relation-Modell entworfen, das folgende Vorteile bietet:

  • unbegrenzte hierarchische Elementtiefe
  • Erweiterbarkeit der Element-Eigenschaften ohne Strukturänderungen
  • Festlegung der Element-Eigenschaften durch Eigenschaftsdefinitionen statt durch die Hierarchieebene
  • Abbildung von Beziehungen zwischen verschiedenen Elementen, z.B. Item-Elementen, als Querrelationen
  • Definition von weiteren Baum- oder Netzstrukturen neben der festen hierarchischen Anordnung der Elemente (Graphen)
  • Unterstützung von ETL-Prozessen bei der Metadatenreferenzen-Anreicherung von Messwerten durch eine generische Verfahrensweise

Die mit diesem Modell beschriebenen Daten lassen sich jederzeit in bekannte Metabeschreibungen (z.B. CDISC ODM) konvertieren, verlieren dabei jedoch regelhaft die Vorteile des generischen Modells.

Die Struktur des Repositorys wird durch das Java-Framework JPA/Hibernate in ein Entity-Relation-Modell überführt, welches die Daten in eine herkömmliche relationale Datenbank persistiert. Somit lassen sich Metadaten sowohl per XML transportieren als auch in Datenbanken persistieren. Die resultierende Schema-Beschreibung der XML-Dokumente sowie die Struktur der Datenbank sind einfach und lesbar.

Ergebnisse: Trotz ständig neuer Änderungs- und Ergänzungswünsche seitens verschiedener Arbeitsgruppen während des Projektverlaufs ließen sich alle Anforderungen durch Erweiterung von Eigenschaftsbeschreibungen umsetzen. Aufwendige Strukturanpassungen des Metadatenmodels ließen sich vollständig verhindern.

Das Prinzip der Eigenschaftsanreicherung wurde auch dazu verwendet, technische Prozesse wie ETL-Prozesse und andere Transformationen zu steuern. So wurde diese Methodik u. a. für den Export der medizinischen Daten in die Data-Warehouse-Lösung „i2b2“ genutzt.

Der generische Ansatz eines Metadata Repositorys wurde erfolgreich umgesetzt. Im nächsten Schritt wird dieser in ein DFG-Förderprojekt (HO 1937/2-1) einfließen, das sich die Modularität von Softwarekomponenten zum Ziel gesetzt hat.

Diskussion: Die implementierten Verfahren bieten die Möglichkeit, Elemente, die z. B. Messpunkte beschreiben, um zusätzliche Eigenschaften zu erweitern. Diese Eigenschaften und ihre zugehörigen Eigenschaftswerte werden durch Personen bzw. durch Prozesse interpretativ verarbeitet und außerhalb der Schemabeschreibung definiert. Bekannte Abbildungsmethoden gehen diesen Weg nicht.

Diese Herangehensweise vereinfacht Strukturen und hat sich als praktisch und vorteilhaft erwiesen, lagert aber die Interpretation von Eigenschaften an Zielsysteme aus. Diese Methodik von Eigenschaften soll in kommenden Forschungsvorhaben weiter untersucht werden.


Literatur

1.
Projekt GANI_MED. "Greifswald Approach to Individualized Medicine". Weblink: http://www.gani-med.de Externer Link
2.
Clinical Data Interchange Standards Consortium (CDISC). Operational Data Model (ODM). Weblink: http://www.cdisc.org/odm [2014-03-31] Externer Link
3.
ISO/IEC 11179. Information Technology - Metadata registries (MDR). Weblink: http://metadata-standards.org/11179 [2014-02-09] Externer Link