gms | German Medical Science

63. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie

02. - 06.09.2018, Osnabrück

Einsatz eines automatischen Generators einheitlicher Qualitätsberichte zur Überprüfung der Datenqualität in einem translationalen Forschungsnetzwerk

Meeting Abstract

  • Esther Erika Schmidt - Deutsches Krebsforschungszentrum, Heidelberg, Deutschland
  • Esmeralda Castaños-Vélez - Experimentelle Neurologie, Charité - Universitätsmedizin Berlin, Berlin, Deutschland
  • Dietmar Keune - Clinical Cancer Registry, Charité Comprehensive Cancer Center, Berlin, Deutschland
  • David Juárez - Deutsches Krebsforschungszentrum, Heidelberg, Deutschland
  • Frank Ückert - Deutsches Krebsforschungszentrum, Heidelberg, Deutschland
  • Martin Lablans - Deutsches Krebsforschungszentrum, Heidelberg, Deutschland

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie. 63. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS). Osnabrück, 02.-06.09.2018. Düsseldorf: German Medical Science GMS Publishing House; 2018. DocAbstr. 245

doi: 10.3205/18gmds017, urn:nbn:de:0183-18gmds0172

Published: August 27, 2018

© 2018 Schmidt et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License. See license information at http://creativecommons.org/licenses/by/4.0/.


Outline

Text

Einleitung: Das Deutsche Konsortium für Translationale Krebsforschung (DKTK) [1] ist ein Zusammenschluss von über 20 Institutionen an neun Standorten mit dem Ziel, Ergebnisse aus der Krebsforschung effektiv in die klinische Praxis einzubringen. Um die klinischen und Biomaterial-Daten der Partner vergleichbar darzustellen, wurde ein Meldedatensatz (MDS) mit definierten Datenelementen und Ausprägungen konsentiert, in einem Metadatenrepository (MDR) [2], [3] beschrieben und in sog. lokalen Brückenköpfen abgelegt [4]. Eine hohe Datenqualität ist eine essentielle Voraussetzung für den Erfolg solcher Datenintegrationsvorhaben in dezentralen Forschungsnetzen. Zu ihrer Überprüfung (hier: Vollständigkeit sowie Konformität mit dem MDR) wurde ein Qualitätsbericht-Generator (QR-Generator) implementiert, der an jedem Standort installiert werden kann, um einen Abgleich der lokalen Daten mit den zentral im MDR definierten Datenelementen vorzunehmen [5].

Methoden: Nach der Installation des QR-Generators am jeweiligen Standort wird ein Qualitätsbericht in Excel-Format erstellt. Dieser listet für jedes Datenelement alle vorhandenen Ausprägungen auf, wobei die nicht-MDR-konformen Ausprägungen markiert sind. Außerdem werden pro Datenelement statistische Berechnungen zur Vollständigkeit und syntaktischen Korrektheit durchgeführt. In einem manuellen Schritt werden die Fehler kategorisiert und Lösungsansätze identifiziert, die am Standort umzusetzen sind. Ein erneuter Qualitätsbericht wird erstellt und mit dem vorigen verglichen, um Änderungen in der Datenqualität festzustellen.

Ergebnisse: An allen neun DKTK-Standorten wurde ein QR-Generator installiert. Als Pilotbeispiel wurden für die Daten des Standorts Berlin im März und August sowie im Dezember 2017 Qualitätsberichte erstellt und verglichen (Anzahl der Patienten in der Datenbank: 104.000 (März), 137.000 (Dezember)). Folgende Fehlerkategorien wurden festgestellt: Quellsystemfehler (inklusive der bewussten Verwendung nicht-standard-konformer Codierung); Fehler aufgrund von Groß- bzw. Kleinschreibung; Fehler im MDS bzw. fehlende Mappings von lokalen Ausprägungen auf den MDS; technische Fehler bei bestimmten Datentypen, v.a. Datumsdefinitionen. Als Lösungsansätze wurden identifiziert:

1.
Fehlerkorrektur direkt im Quellsystem unter kontrollierten Bedingungen nach SOP;
2.
Korrektur von a) systematischen Abweichungen sowie b) Mappings auf Ausprägungs- oder Elementebene durch Anpassung der technischen Schnittstellen.

Von 52 geprüften Datenelementen waren 21 von Beginn an syntaktisch korrekt. Zwei Datenelemente wurden vollständig direkt im Quellsystem korrigiert. Systematische Abweichungen wie zum Beispiel Groß-/Kleinschreibungsfehler oder Textzusätze im Quellsystem konnten durch Änderungen an der Schnittstelle behoben werden und die MDR-Konformität der betroffenen Datenelemente erheblich verbessern, in sechs Fällen auf über 95%. Bei drei Datenelementen führte dies, zusammen mit einer Anpassung des Mappings auf Ausprägungsebene, zu vollständiger MDR-Konformität.

Die Vollständigkeit der Datenelemente (in Bezug auf die Gesamtzahl der Patienten) weist Schwankungen sowohl zwischen Datenelementen als auch zwischen Berichten von verschiedenen Zeitpunkten auf.

Diskussion: Einheitliche Qualitätsberichte können der Überprüfung und Verbesserung der Datenqualität an DKTK-Standorten dienen. Davon profitieren nicht nur Verbundpartner, die lokale Daten übergreifend nutzen möchten, sondern auch die Kuratoren der Quellsysteme (hier: Tumordokumentation), die mithilfe der Qualitätsberichte Fehler identifizieren und korrigieren können. Aufgrund der Dynamik durch neu hinzukommende Datenelemente und wachsende Fallzahlen stellt die Sicherung der Datenqualität eine kontinuierliche Herausforderung dar. Zukünftig könnten auch weitere Dimensionen der Datenqualität, wie z.B. Plausibilität, in Betracht gezogen werden.

Die Autoren geben an, dass kein Interessenkonflikt besteht.

Die Autoren geben an, dass kein Ethikvotum erforderlich ist.


Literatur

1.
Klinische Kommunikationsplattform (CCP) im DKTK. Available from: https://dktk.dkfz.de/de/klinische-plattformen/ueber-die-ccp/about-ccp External link
2.
Sinaci AA, Laleci Erturkmen GB. A federated semantic metadata registry framework for enabling interoperability across clinical research and care domains. J Biomed Inform. 2013;46(5):784-94. DOI: 10.1016/j.jbi.2013.05.009. External link
3.
Metadata Repository (MDR) des DKTK. Available from: https://mdr.ccp-it.dktk.dkfz.de External link
4.
Lablans M, Schmidt EE, Ückert F. An Architecture for Translational Cancer Research As Exemplified by the German Cancer Consortium. JCO Clinical Cancer Informatics. 2017;(1):1-8. DOI: 10.1200/CCI.17.00062. External link
5.
Juarez D, Schmidt EE, Lablans M, Senghas K, Ückert F. Report generator for the external validation of conformity of local clinical data to a global metadata repository (MDR). In: Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie, Hrsg. 62. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS). Oldenburg, 17.-21.09.2017. Düsseldorf: German Medical Science GMS Publishing House; 2017. DocAbstr. 293 (Abstr. 293). DOI: 10.3205/17gmds169 External link