gms | German Medical Science

GMDS 2014: 59. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie

07. - 10.09.2014, Göttingen

Entwicklung eines Minimaldatensatzes (MDS) für das Interdisziplinäre Centrum für Biobanking – Lübeck (ICB-L)

Meeting Abstract

  • P. Duhm-Harbeck - IT for Clinical Research (ITCR), Universität zu Lübeck, Lübeck
  • M. Petzold - IT for Clinical Research (ITCR), Universität zu Lübeck, Lübeck
  • M. Oberländer - Interdisziplinäres Centrum für Biobanking - Lübeck (ICB-L), Universität zu Lübeck, Lübeck
  • J.K. Habermann - Interdisziplinäres Centrum für Biobanking - Lübeck (ICB-L), Universität zu Lübeck, Lübeck; Sektion für Translationale Chirurgische Onkologie und Biomaterialbanken, Klinik für Chirurgie, Universität zu Lübeck und Universitätsklinikum Schleswig-Holstein (UKSH), Campus Lübeck, Lübeck
  • J. Ingenerf - IT for Clinical Research (ITCR), Universität zu Lübeck, Lübeck; Institut für Medizinische Informatik, Universität zu Lübeck, Lübeck

GMDS 2014. 59. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS). Göttingen, 07.-10.09.2014. Düsseldorf: German Medical Science GMS Publishing House; 2014. DocAbstr. 311

doi: 10.3205/14gmds103, urn:nbn:de:0183-14gmds1034

Veröffentlicht: 4. September 2014

© 2014 Duhm-Harbeck et al.
Dieser Artikel ist ein Open Access-Artikel und steht unter den Creative Commons Lizenzbedingungen (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.de). Er darf vervielfältigt, verbreitet und öffentlich zugänglich gemacht werden, vorausgesetzt dass Autor und Quelle genannt werden.


Gliederung

Text

Einleitung und Fragestellung: Das Interdisziplinäre Centrum für Biobanking – Lübeck (ICB-L) ist der Zusammenschluss von 21 Kliniken und Instituten der Universität zu Lübeck und des Universitätsklinikums Schleswig-Holstein, Campus Lübeck mit ihrem jeweiligen Fokus auf Biomaterial-gestützte translationale Forschung im Versorgungskontext [1]. Durch eine Zentralisierung von klinik- und institutsindividuellen Biomaterialbanken wird dem Bedarf an einer kosteneffizienten, qualitätssichernden, transparenten und einheitlichen Lagerung von Biomaterialien nachgekommen. Hierzu wird eine Probenmanagementsoftware benötigt, die Ärzte, Labormitarbeiter und Wissenschaftler darin unterstützt, unter Wahrung von Ethik und Datenschutz sowohl Daten zu Proben (hinsichtlich Entnahme, Aufbereitung, Einlagerung usw.) als auch zu Patienten (u.a. mit demographischen und klinischen Merkmalen aus dem Versorgungskontext) zu verarbeiten. In diesem Beitrag wird beschrieben, wie auf Basis der bereits in den partizipierenden Institutionen verwendeten Merkmalsdatensätze ein Minimaldatensatz (MDS) ermittelt wird, um später ein übergreifendes Suchen und Zusammenstellen von Probenkollektiven zu ermöglichen.

Material und Methoden: Zunächst wurde von allen teilnehmenden Kliniken und Instituten eine Liste von Merkmalen erbeten, die aus ihrer Sicht erforderlich sind, um in Ablösung ihrer bisherigen lokalen IT-Lösung mit dem anvisierten zentralen Probenmanagementsystem ihre Aufgaben erledigen zu können. Im Rahmen der Aufarbeitung der Menge aller Parameter wurden sie zunächst normiert und dann kategorisiert hinsichtlich des Merkmalsbezuges wie Probe, Patient und weiter hinsichtlich klinischer Merkmale wie Diagnosen oder Laborwerte. Dies erlaubt gleichzeitig, jene Attribute zu identifizieren, die über Schnittstellen aus IT-Systemen im Versorgungskontext importiert werden, z.B. Laborwerte, Medikation, Tumordokumentation. Die übermittelten Daten werden auf Relevanz für den MDS überprüft. Ein großer Teil der Versorgungsdaten ist jedoch nicht für alle, aber für einzelne Kliniken/Institute von großem Interesse. Diese über die Schnittstellen implizit abgestimmten Merkmale erweitern sozusagen den in diesem Papier diskutierten Minimaldatensatz.

Mit Fokus auf die nicht importierbaren Parameter werden deren Bezeichnungen möglichst normiert und geeignete Datentypen festgelegt. Weiterhin wird versucht, für möglichst viele qualitative Attribute vom Datentyp „String“ eine strukturierte Wertemenge sowie für quantitative Attribute definierte Referenzbereiche und Einheiten zuzuordnen. Schließlich wird der Merkmalsdatensatz mit vorhandenen Standards wie den Minimaldatensätzen der BBMRI [2] (Biobanking and Biomolecular Resources Research Infrastructure) oder des P2B2 [3] (Projekt-Portal im Deutschen Biobanken-Register) abgeglichen. Hierzu gehört auch die Berücksichtigung des SPREC (Standard PREanalytical Code) zur Charakterisierung von Biomaterialproben. Aus der Ergebnismenge aller aufbereiteten Parameter wird schließlich eine Schnittmenge bestimmt, die als stabiler Kern übereinstimmender Merkmale den ICB-L-Minimaldatensatz darstellt und in einem zyklischen Rückkopplungs-Prozess auf Vollständigkeit validiert und ergänzt wird.

Ergebnisse: Die erhobenen Merkmale entstammen verschiedensten lokalen IT-Lösungen und sind entsprechend strukturell und sprachlich heterogen.

Die Gesamt-Merkmalsliste über alle 21 Institutionen hinweg kann bereits durch Normierung von unterschiedlichen Schreibweisen und Sprachvarianten reduziert werden. Mit den verbleibenden Attributen wird gemäß der oben beschriebenen Vorgehensweise verfahren. Der erwähnte Abgleich mit verfügbaren Minimaldatenstandards wie BBMRI [2] ist sinnvoll. Allerdings sind zwischen standortbezogenen Biobanken und den durch die Standards üblicherweise adressierten standortübergreifenden Biobanken auf Data Warehouse-Ebene Unterschiede zu verzeichnen. Einerseits interessieren Merkmale wie „Categories of data collected (MIABIS 46)“ nicht. Umgekehrt sind im MDS in Lübeck personenbezogene Merkmale erforderlich, um das Biobanking im klinischen Versorgungskontext zu ermöglichen.

Auf Basis der so aufbereiteten und strukturierten Merkmalsliste können proben- und patientenspezifische Merkmale als klinik- und institutsübergreifender MDS festgelegt werden, der als kleinster gemeinsamer Nenner des Ausgangsdatensatzes aller ICB-L-Nutzer in das Datenbank-Schema von CentraXX der Firma KAIROS aufgenommen wird. Zusätzlich zu diesem MDS existiert der oben erwähnte erweiterte Anteil von über Schnittstellen verfügbarer Versorgungsdaten sowie eine durchaus große Anzahl an restlichen klinik- und institutsspezifischen Parametern.Die zuletzt genannten restlichen Merkmale stehen Klinik-/Instituts-spezifisch zur Verfügung, werden aber eher nicht ICB-L-übergreifend auswertbar sein. Die über den MDS hinausgehenden zusätzlichen Merkmale werden technisch nach dem Prinzip des EAV-Modells [4] umgesetzt, um der Heterogenität und Dynamik sich ändernder Datensätze gerecht zu werden, da sie sich zur Laufzeit ändern können.

Diskussion: Der MDS kann aus Sicht der Informatik nur eine eng umgrenzte Menge an strukturierten Merkmalen und kodierten Ausprägungen sein. Eine Maximierung von Strukturvorgaben für den gesamten Ausgangsdatensatz aller ICB-L-Nutzer würde eine Minderung der Praktikabilität für den Endnutzer bedeuten. Dies würde zu einer verminderten Akzeptanz der Endnutzer führen. Gleichwohl ist für die weitere Zukunft eine Datensammlung auf der Grundlage von Standards anzustreben.


Literatur

1.
Interdisziplinäres Centrum für Biobanking-Lübeck. www.biobank.uni-luebeck.de Externer Link
2.
Norlin L, Fransson M, Eriksson M, Merino-Martinez R, Anderberg M, Kurtovic S, Litton J-E. Biopreservation and Biobanking.2012 August;10(4):343-8. doi:10.1089/bio.2012.0003. Externer Link
3.
Schröder C (Fraunhofer IBMT). Projektportal im Deutschen Biobankenregister (P2B2) Kick-off des DBR. 24. April 2012, Berlin [Präsentation].
4.
Nadkarni P, Marenco L, Chen R, Skoufos E, Shepherd G, Miller P. Organization of Heterogeneous Scientific Data Using the EAV/CR Representation. Am Med Inform Assoc. 1999;6:478-93. doi:10.1136/jamia.1999.0060478. Externer Link