gms | German Medical Science

16. Deutscher Kongress für Versorgungsforschung

Deutsches Netzwerk Versorgungsforschung e. V.

4. - 6. Oktober 2017, Berlin

Vergleichbare Auswertungsergebnisse über Änderungen in Klassifikationen hinweg ohne den Einsatz von Approximationen

Meeting Abstract

Search Medline for

  • Christian Lüpkes - OFFIS - Institut für Informatik, Oldenburg, Germany

16. Deutscher Kongress für Versorgungsforschung (DKVF). Berlin, 04.-06.10.2017. Düsseldorf: German Medical Science GMS Publishing House; 2017. DocP030

doi: 10.3205/17dkvf292, urn:nbn:de:0183-17dkvf2929

Published: September 26, 2017

© 2017 Lüpkes.
This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License. See license information at http://creativecommons.org/licenses/by/4.0/.


Outline

Text

Hintergrund: Bei Auswertungen medizinischer Daten ist die Berücksichtigung von Änderungen in den Metadaten besonders wichtig, um vergleichbare Aussagen über längere Zeiträume zu erhalten. Gleichzeitig ist die Dynamik bzgl. Änderungen im Gesundheitswesen häufig sehr prägnant. Diagnosen z.B. werden in vielen Ländern der Welt nach der Klassifikation International Statistical Classification of Diseases and Related Health Problems (ICD) erfasst und die deutsche Modifikation (ICD-GM) jährlich vom DIMDI aktualisiert. Dazu werden neu identifizierten Erkrankungen Codes zugewiesen, bestehende Codierungen zusammengefasst oder einzelne Bereiche von Krankheiten neu unterteilt, wobei sich jedes Jahr ca. 1,5% der Einträge des ICD-GM 10 änderten.

Fragestellung: Wie lassen sich Änderungen in Klassifikationen mittels IT-Unterstützung so auswerten, dass Nutzern inhaltliche Änderungen angezeigt werden und eine erfolgte Veränderung der Modellierung bei der Ergebnisgenerierung berücksichtigt werden kann, ohne dass eine vorherige, potentiell mit Informationsverlust behaftete Anpassung der gespeicherten Datengrundlage notwendig ist.

Methode: Der Ansatz basiert auf einer graphenbasierten Ad-hoc-Datentransformation, bei der Änderungen in den Klassifikationen visualisiert und für Auswertungen verwendbar gemacht werden. Metadatenänderungen können dabei sowohl syntaktischer als auch semantischer Natur sein und werden als verbindende Kanten zwischen verschiedenen Versionen einer Klassifikation modelliert (Überleitungen), wobei diese Klassifikation als Graphenstruktur aufgefasst werden.

Durch die Interpretation der Verbindungen für eine Analyseanfrage werden sogenannte Evolutionspfade identifiziert, die aus Mengen von verbundenen Klassifikationselementen verschiedener Versionen bestehen. Die Evolutionspfade repräsentieren dabei domänenspezifisches Hintergrund: wissen, welches in den Überleitungen repräsentiert ist, wie z. B. die Bedeutungsänderung von Codierungen über die Zeit.

Nutzer können dieses Hintergrund wissen visuell erfassen und sich für einen geeigneten Evolutionspfad entscheiden. Die Analyseanfrage wird dann zur Anfragezeit so umgewandelt, dass die auszuwertenden Daten zum Zeitpunkt der Anfrage und speziell für deren Zwecke unter die gewählte Bedeutung des Evolutionspfads transformiert werden. Dabei wird auf eine tatsächliche Umcodierung der Datenbasis sowie die Nutzung von Approximationen verzichtet.

Ergebnisse: Der als IT-Prototyp umgesetzte Ansatz wurde, neben einer Gebietsklassifikation, mit den vom DIMDI für die ICD-GM bereitgestellten Überleitungen der Jahre 2004 bis 2012 getestet. Der IT-Prototyp wurde u. A. neun Personen aus dem Bereich Krebsepidemiologie im Rahmen einer Befragung vorgestellt. Hier fanden acht Personen sowohl die Visualisierung als auch den Ansatz hilfreich. Insbesondere die aus der Visualisierung gewonnene Erkenntnis, dass einzelne Codes für vergleichbare Ergebnisse bei Anfragen hinzugefügt werden mussten, wurde als überraschend angesehen. Dies wurde an dem ICD-GM 10 Code C80 gezeigt, der von der Version 2009 zu 2010 restrukturiert und ein Teil zu C79.9 exkludiert wurde. Für inhaltlich vergleichbare Ergebnisse zu C80 aus 2009 müssten ab 2010 die Codes C80, C80.0, C80.9 als auch C79.9 betrachtet werden.

Alle Befragten gaben an, bereits selbst mit dem Problem der sich ändernden Codierungen und Bedeutungen konfrontiert gewesen zu sein.

Für Analysen wurde der Prototyp bisher nur für Daten der strukturierten Qualitätsberichte der Krankenhäuser der Berichtsjahre 2006, 2008 und 2010 verwendet. Hier gab es Hinweise, dass die Ergebnisse die Entwicklung von Fallzahlen für angefragte Diagnosen besser abbilden als ohne die Berücksichtigung aller zugehörigen Überleitungen des DIMDI.

Diskussion: Die Identifizierung verschiedener Bedeutungen von Codierungen und die Visualisierung von Änderungen in Klassifikationen wurde von Nutzern aus dem epidemiologischen Bereich als nützlich angesehen. Um den Nachweis zu erbringen, dass die Ergebnisse der Analysen besser sind, bedarf es konkreter Auswertungen von medizinischen Daten aus einem längeren Zeitraum. Da der Ansatz aus der IT entwickelt wurde ist hier noch Bedarf an einer inhaltlichen Überprüfung durch die Versorgungsforschung bzw. Epidemiologie.

Praktische Implikationen: Um die Veränderungen in Klassifikationen wie der ICD-GM 10 nachvollziehen zu können braucht es Systeme zur Aufbereitung der Überleitungen. Der skizzierte Ansatz ist für Datengrundlagen geeignet, bei denen bekannt ist nach welcher Version einer Klassifikation die Daten erfasst und gespeichert wurden. Eine kennzahlabhängige Approximation zur Umcodierung einzelner Werte wird nicht benötigt. Dadurch müssen gegebenenfalls Gruppen von Codierungen analysiert werden, im Gegenzug wird eine Unschärfe durch Schätzwerte ausgeschlossen und der Ansatz ist direkt ohne Anpassung der Datenbasis nutzbar.