gms | German Medical Science

21. Deutscher Kongress für Versorgungsforschung

Deutsches Netzwerk Versorgungsforschung e. V.

05.10. - 07.10.2022, Potsdam

Hybride Qualitätsindikatoren mittels Machine Learning-Methoden (Hybrid-QI)

Meeting Abstract

  • Melissa Spoden - Wissenschaftliches Institut der AOK, Berlin, Deutschland
  • Patrik Dröge - Wissenschaftliches Institut der AOK, Berlin, Deutschland
  • Martin Roessler - Zentrum für Evidenzbasierte Gesundheitsversorgung, Dresden, Deutschland
  • Thomas Datzmann - Zentrum für Evidenzbasierte Gesundheitsversorgung, Dresden, Deutschland; Nationales Centrum für Tumorerkrankungen (NCT), Dresden, Deutschland
  • Caroline Lang - Zentrum für Evidenzbasierte Gesundheitsversorgung, Dresden, Deutschland
  • Martin Sedlmayr - Institut für medizinische Informatik & Biometrie, Dresden, Deutschland
  • Jochen Schmitt - Zentrum für Evidenzbasierte Gesundheitsversorgung, Dresden, Deutschland
  • Christian Günster - Wissenschaftliches Institut der AOK, Berlin, Deutschland

21. Deutscher Kongress für Versorgungsforschung (DKVF). Potsdam, 05.-07.10.2022. Düsseldorf: German Medical Science GMS Publishing House; 2022. Doc22dkvf107

doi: 10.3205/22dkvf107, urn:nbn:de:0183-22dkvf1073

Published: September 30, 2022

© 2022 Spoden et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License. See license information at http://creativecommons.org/licenses/by/4.0/.


Outline

Text

Hintergrund: International werden Routinedaten zur Definition von Qualitätsindikatoren genutzt, um stationäre Behandlungsqualität zu erfassen. Fallübergreifende Routinedaten erlauben bei geringem administrativen Aufwand die sektorenübergreifende Longitudinalanalyse von Behandlungsfolgen inner- und außerhalb des initialen Klinikaufenthaltes. Aufgrund des Erhebungskontextes kann die Dokumentation von Outcomes und Risikofaktoren in Abrechnungsdaten jedoch stark eingeschränkt sein. Demgegenüber werden innerklinisch medizinische Daten erfasst, die für eine externe Qualitätsmessung relevant sein können, aber oft nicht einheitlich und systematisch elektronisch abgelegt werden. Hybride Qualitätsindikatoren (Hybrid-QI) verknüpfen klinische und administrative Daten auf Patientenebene [1].

Ziel: Ziel dieser longitudinalen Sekundärdatenanalyse ist es, GKV-Routinedaten mit klinischen Datensätzen zu verknüpfen und in einem Observational Medical Outcomes Partnership (OMOP) Common Data Model (CDM) zu harmonisieren. Auf Grundlage der verknüpften und harmonisierten Daten werden a) hybride Qualitätsindikatoren für vier akut-stationäre Leistungsbereiche entwickelt und minimal erforderliche klinische Datensets identifiziert, b) mit Machine Learning-Methoden Surrogate klinischer Daten in GKV-Routinedaten identifiziert und Variablen für Risikoadjustierungsmodelle selektiert und c) die Ergebnisse im Rahmen einer dynamischen Plattform zur aufwandsarmen Qualitätsmessung, Risikostratifizierung und Reporting teilnehmenden Kliniken zur Verfügung gestellt. Betrachtet werden der akute Schlaganfall und Herzinfarkt sowie Operationen bei kolorektalem Karzinom und proximaler Humerusfraktur.

Methode: Potentiell relevante Variablen zur Risikoadjustierung oder Outcomemessung werden in Panels mit Experten aus den o.g. vier Leistungsbereichen festgelegt und hinsichtlich Machbarkeitskriterien geprüft. Die ausgewählten Variablen werden aus beiden Datenquellen auf ein CDM harmonisiert und auf Patientenebene gelinkt. Im gelinkten Datensatz werden verschiedene Verfahren des Machine Learnings zur Variablenselektion und Modellierung erprobt. Zunächst werden bislang unbekannte Muster aus Variablen (Itemsets/Sequenzen) mithilfe von Classical Unsupervised-Methoden des Machine Learnings wie bspw. des Frequent Pattern Growth Algorithm und zugleich Surrogate der klinischen Daten in den GKV-Daten identifiziert. Die Eignung Künstlicher Neuronaler Netze wird hinsichtlich der Identifikation der prädiktiven Kraft einzelner Variablen für Outcome und Assoziationen zwischen den Variablen evaluiert. In regressionsbasierten Verfahren, wie u.a. der Ridge- und LASSO-Regressionen, könnten Variablenselektion und Modellierung in einem Schritt durchgeführt werden. Die Modellselektion wird über eine multiple Cross-Validierung realisiert.

Förderung: Innovationsfonds/Versorgungsforschung; 01VSF20013


Literatur

1.
CMS, Hybrid 30-day Risk-standardized Acute Myocardial Infarction (AMI) Mortality Measure with Electronic Health Record (EHR)-Extracted Risk Factors. 2015. Availabe from: https://www.cms.gov/Medicare/Quality-Initiatives-Patient-Assessment-Instruments/HospitalQualityInits/Measure-Methodology External link