gms | German Medical Science

Data Engineering für die Sekundärnutzung von Gesundheitsdaten in Deutschland: Ein Forschungsdesiderat

Data engineering for secondary use of protected health information in Germany: A research desideratum

Meeting Abstract

Suche in Medline nach

  • Danny Ammon - Universitätsklinikum Jena; SMITH-Konsortium der Medizininformatik-Initiative
  • Julia Palm - Universitätsklinikum Jena; SMITH-Konsortium der Medizininformatik-Initiative
  • Cord Spreckelsen - Universitätsklinikum Jena; SMITH-Konsortium der Medizininformatik-Initiative
  • André Scherag - Universitätsklinikum Jena; SMITH-Konsortium der Medizininformatik-Initiative

SMITH Science Day 2022. Aachen, 23.-23.11.2022. Düsseldorf: German Medical Science GMS Publishing House; 2023. DocV10

doi: 10.3205/22smith09, urn:nbn:de:0183-22smith091

Veröffentlicht: 31. Januar 2023

© 2023 Ammon et al.
Dieser Artikel ist ein Open-Access-Artikel und steht unter den Lizenzbedingungen der Creative Commons Attribution 4.0 License (Namensnennung). Lizenz-Angaben siehe http://creativecommons.org/licenses/by/4.0/.


Gliederung

Text

Einleitung und Zielstellung: Im Rahmen der Medizininformatik-Initiative (MII) [1] wird derzeit eine nachhaltige Infrastruktur für die Sekundärnutzung von Versorgungsdaten aus Gesundheitseinrichtungen etabliert. Die Universitätsklinika Deutschlands richten dafür Datenintegrationszentren (DIZ) als neue Organisationseinheiten mit eigenen Ressourcen ein. Das Aufgabenspektrum an den DIZ ergibt sich aus den Vorgaben der Förderinitiative, den Arbeitsplänen der MII-Konsortien und den Umsetzungsbeschlüssen des Nationalen Steuerungsgremiums [2]. Insbesondere die bereits in der Förderrichtlinie ausbedingten Aspekte von Interoperabilität und FAIR Data determinieren heute einen wichtigen Arbeitsanteil der DIZ, insofern heutige Behandlungsdaten solchen Prinzipien in Deutschland noch nicht entsprechen.

Die konkreten Umsetzungen der Arbeitsaufgaben in den DIZ, ihre Ressourcenbeanspruchung und ihre Ergebnisse, vor allem in Form wissenschaftlicher Publikationen, sind jedoch im Zuge des Aufbaus und über die vier MII-Konsortien noch wenig untersucht. Das betrifft speziell die Tätigkeiten zur Erzeugung interoperabler, den FAIR-Prinzipien entsprechender Daten und Datenarchitekturen. Ein erster Vorstoß in diese Richtung und sich daraus ergebende Themen für die gemeinsame Weiterarbeit in der MII-Ausbau- und Erweiterungsphase ab 2023 sind Gegenstand des vorliegenden Beitrags.

Methoden: Als wichtigste Arbeitsfelder der DIZ lassen sich anhand der Zielsetzungen der MII in der Aufbau- und Vernetzungsphase identifizieren:

  • Data Engineering, vgl. z.B. [3] – das Erzeugen interoperabler, standortübergreifend für Forschung nutzbarer Datenbestände (MII-Kerndatensatz),
  • Data Architecture Design, vgl. z.B. [4] – die Konzeption standorteigener und MII-weiter Infrastrukturen für die Nutzung der dezentralen Datenbestände in den DIZ
  • Data Analytics und Data Sharing – die eigentliche Bereitstellung, Analyse und Ergebnisgewinnung in konkreten Datennutzungsprojekten

Diesen Arbeitsfeldern sind weitere Tätigkeiten in Bereichen wie Qualitätsmanagement, Datenschutz und IT-Sicherheit sowie Betrieb von etablierten IT-Verfahren hinzuzufügen.

Die im Zuge der bisherigen Phasen der MII entstandenen Publikationen der Konsortien und der MII sind auf den Webseiten der Konsortien und MII gelistet. Auf diese Basis lässt sich der Großteil der in der MII entstandenen Fachveröffentlichungen auflisten und durch inhaltliche Prüfung den angeführten Arbeitsfeldern zuordnen. Die entstehende Verteilung kann mit den an den DIZ durchgeführten Tätigkeiten und ihrer Ressourcenverteilung verglichen werden (s. Abbildung 1 [Abb. 1]).

Ergebnisse: Der überwiegende Teil wissenschaftlicher Publikationen aus der MII lässt sich nicht direkt den Arbeitsfeldern zu strukturierten Behandlungsdaten zuordnen. Es handelt sich um Beschreibungen konkreter Forschungsprojekte oder um weitere Themen der MII wie Lehre, Datenschutz, Patienteneinwilligung, NLP-Verfahren u.w.m.

Ca. 13% der Veröffentlichungen lassen sich als Data-Engineering-Beiträge klassifizieren, ca. 19% fallen in den Bereich Data Analytics und rund 25% der MII-Publikationen betreffen Data Architecture Design. Es fällt auf, dass der in den DIZ besonders arbeitsintensive Bereich der Erstellung interoperabler Daten für den MII-Kerndatensatz nur einen kleinen Teil der wissenschaftlichen Publikationen der MII ausmacht. Insbesondere wird wenig zu ETL-Prozessen von Primärdokumentationssystemen publiziert, zum Herstellen syntaktischer Interoperabilität (der Einsatz semantischer Standards ist dagegen öfter Bestandteil von Veröffentlichungen) oder zu Betriebsthemen für entsprechende IT-Verfahren.

Diskussion: Ein wichtiger Teil des Aufbaus der DIZ sind die dort etablierten neuen IT-Architekturen und -Verfahren, ihre Kompatibilität und die Möglichkeiten eines konsortienübergreifenden Austauschs hierzu. Wenngleich die vorliegende Untersuchung nur auf website-gelistete Publikationen eingehen konnte, wodurch es zu Dopplungen und fehlenden Beiträgen kommt, und die Kategorisierung sowie inhaltliche Zuordnung auf der Autorenexpertise und Erfahrungen aus dem DIZ des Universitätsklinikums Jena beruhen, sind die möglichen Gründe für die mangelnden Publikationstätigkeiten gerade im Bereich Data Engineering nähere Untersuchungen wert. Eine Problemstellung kann die „handwerkliche“ Natur der Tätigkeiten im Schnittstellen- und Betriebsbereich sein, denen für wissenschaftliche Veröffentlichungen z.B. Neuheitswerte fehlen, die aber dennoch große Ressourcenanteile der MII insgesamt beanspruchen. Auch die Arbeit mit Software am DIZ insgesamt, die sich im Spannungsfeld zwischen kommerziellen und akademisch entwickelten Lösungen bewegen muss, kann ein Hinderungsfaktor für wissenschaftliche Arbeit in diesem Bereich sein. Auch Fachkräftemangel und dadurch entstehende Priorisierung kann Personal von der Publikationstätigkeit abhalten. Diese möglichen Problemstellungen sollten in Zukunft näher analysiert und Lösungen zugeführt werden. Insgesamt erscheint auch eine bessere Übersicht über die Publikationstätigkeit der MII und ihrer Standorte wünschenswert.


Literatur

1.
Semler SC, Wissing F, Heyder R. German Medical Informatics Initiative. Methods Inf Med. 2018 Jul;57(S 01):e50-6. DOI: 10.3414/ME18-03-0003 Externer Link
2.
Technologie- und Methodenplattform für die vernetzte medizinische Forschung, TMF e.V. Vernetzen. Forschen. Heilen. Medizininformatik-Initiative [Internet]. 2022. Verfügbar unter https://www.medizininformatik-initiative.de Externer Link
3.
Reis J, Housley M. Fundamentals of Data Engineering. Sebastopol, CA: O'Reilly Media; 2022.
4.
Ganzinger M, Glaab E, Kerssemakers J, Nahnsen S, Sax U, Schaadt NS, Schapranow MP, Tiede T. Biomedical and clinical research data management. In: Wolkenhauer O, ed. Systems medicine. Integrative, qualitative and computational approaches. Vol 3. Amsterdam: Academic Press; 2021. p. 532-43. DOI: 10.1016/B978-0-12-801238-3.11621-6 Externer Link