gms | German Medical Science

62. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie

17.09. - 21.09.2017, Oldenburg

Mehrdimensionale Klassifikation lungenspezifischer Parameter im Forschungsverbund

Meeting Abstract

Suche in Medline nach

  • Mark R. Stöhr - Universities of Giessen and Marburg Lung Center (UGMLC), Justus-Liebig-Universität Gießen, Gießen, Deutschland
  • Raphael W. Majeed - Universities of Giessen and Marburg Lung Center (UGMLC), Justus-Liebig-Universität Gießen, Gießen, Deutschland
  • Andreas Günther - Universities of Giessen and Marburg Lung Center (UGMLC), Justus-Liebig-Universität Gießen, Gießen, Deutschland

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie. 62. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS). Oldenburg, 17.-21.09.2017. Düsseldorf: German Medical Science GMS Publishing House; 2017. DocAbstr. 263

doi: 10.3205/17gmds178, urn:nbn:de:0183-17gmds1781

Veröffentlicht: 29. August 2017

© 2017 Stöhr et al.
Dieser Artikel ist ein Open-Access-Artikel und steht unter den Lizenzbedingungen der Creative Commons Attribution 4.0 License (Namensnennung). Lizenz-Angaben siehe http://creativecommons.org/licenses/by/4.0/.


Gliederung

Text

Einleitung: Das Deutsche Zentrum für Lungenforschung (DZL) ist ein Forschungsnetzwerk mit dem Ziel, Lungenerkrankungen zu erforschen und zu heilen. Für retrospektive Studien und Patientenrekrutierung spielen Phänotypen (die primären Lungenkrankheiten) und Spezimen (biologische Proben) eine wichtige Rolle. Das DZL-weit genutzte Vokabular für diese Parameter ist eine flache und historisch gewachsene Liste. Forscher beklagen die fehlende Struktur, fehlende Parameter, sowie fehlende Zusatzinformationen zu den Proben wie beispielsweise die Entnahmeart oder Fixierung. Eine Auflistung aller möglichen Kombinationen von Parameter und Zusatzinformation wäre weder überschaubar noch problemlos zu pflegen. Vorhandene Systeme wie SNOMED-CT oder LOINC genügen nicht unseren Anforderungen hinsichtlich Vollständigkeit und Detaillierungsgrad. Daher wurde ein System zur Klassifizierung der Phänotypen und Spezimen entwickeln.

Methoden: Die fünf Standorte vertretenden 27 Mitglieder des DZL-Team Biobanking und Data Management besprachen die Phänotypen- und Probenliste in regelmäßigen Konferenzen. Zunächst wurde eine Anforderungsanalyse durchgeführt: (1) Statt eine statische Liste aller möglicher Kombinationen von Parameter und Spezifikation zu bilden, müssen diese nach Bedarf dynamisch aus Elementen entsprechender Dimensionen zusammengesetzt werden können. (2) Für jede Dimension eines Konzepts soll die natürlich gegebene Hierarchie gewahrt werden. Beispielsweise ist "Zitratplasma" unter anderem ein Unterkonzept von "Plasma" und "Einfrieren von Gewebeproben" ist ein Unterkonzept von "Fixierung von Gewebeproben". (3) Die Liste muss vollständig sein und alle Parameter eines jeden Standortes beinhalten. (4) Die Liste muss erweiterbar sein. (5) Zu Kommunikationszwecken benötigt es ein Kodierungssystem.

Ergebnisse: Wir haben ein System zur dynamischen Zusammensetzung benötigter Konzepte entwickelt, wobei jede Komponente bzw. Dimension hierarchisch geordnet ist: (1) Während Phänotypen keine Zusatzinformationen benötigen, wurden Spezimen in sieben Kategorien mit jeweiligen spezifizierenden Dimensionen unterteilt. Blutproben werden beispielsweise nur bezüglich ihres Derivats unterschieden, Gewebeproben aber auch bezüglich Entnahmeart und Fixierung. Ein Konzept setzt sich aus der Probe und entsprechenden Spezifizierungen zusammen. (2) Jede Dimension ist gemäß der natürlichen Relation "detailreicher / weniger allgemein" bzw. "detailärmer / allgemeiner" hierarchisiert. (3) Die resultierende Liste beinhaltet 215 Phänotypen (zuvor 115), 115 Probenarten und 37 Spezifizierungen, welche sich zu 3718 Konzepten zusammensetzen lassen (zuvor insgesamt 68 teils spezifizierte Spezimen). (4) Es können alle Dimension beliebig erweitert und auch neue Dimensionen hinzugefügt werden. (5) Jedes Konzept besitzt einen eindeutigen Code. Er setzt sich aus Kürzeln der verschiedenen Dimensionen zusammen, welche mit Bindestrichen verbunden werden. Beispielsweise steht der Code "T-LTP--P" für ein "tissue" mit Typ "lung tissue peripheral" und Fixierung "paraffin embeeded", welches bezüglich Entnahmeart und Derivat nicht näher spezifiziert wurde.

Diskussion: Das von uns entwickelte System zur dynamischen Erstellung von Phänotypen- und Spezimen-Konzepten genügt unseren Ansprüchen bezüglich Struktur, Handhabung, Vollständigkeit und Erweiterbarkeit. Der wesentliche Teil der Klassifizierung wird in unser zentrales Datawarehouse integriert und liefert dank der hierarchischen Relationen aussagekräftigere Ergebnisse als eine flache Liste. Beispielsweise findet man dank der Metainformationen bei der Suche nach Patienten mit entnommenem Blutplasma auch Patienten mit entnommenem Zitratplasma. Um Interoperabilität mit anderen System zu gewährleisten, wurden Codes aus anderen Terminologien wie SPREC, LOINC, SNOMED-CT, ICD-O und ICD-10 annotiert.



Die Autoren geben an, dass kein Interessenkonflikt besteht.

Die Autoren geben an, dass kein Ethikvotum erforderlich ist.