gms | German Medical Science

MAINZ//2011: 56. GMDS-Jahrestagung und 6. DGEpi-Jahrestagung

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V.
Deutsche Gesellschaft für Epidemiologie e. V.

26. - 29.09.2011 in Mainz

Ähnlichkeitsalgorithmus für medizinische Daten: Rechnungsprüfungssoftware als ein Anwendungsbereich

Meeting Abstract

Suche in Medline nach

  • Tim Peter - Universität Bern, Bern
  • Simon Hölzer - SwissDRG AG, Bern

Mainz//2011. 56. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds), 6. Jahrestagung der Deutschen Gesellschaft für Epidemiologie (DGEpi). Mainz, 26.-29.09.2011. Düsseldorf: German Medical Science GMS Publishing House; 2011. Doc11gmds486

DOI: 10.3205/11gmds486, URN: urn:nbn:de:0183-11gmds4865

Veröffentlicht: 20. September 2011

© 2011 Peter et al.
Dieser Artikel ist ein Open Access-Artikel und steht unter den Creative Commons Lizenzbedingungen (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.de). Er darf vervielfältigt, verbreitet und öffentlich zugänglich gemacht werden, vorausgesetzt dass Autor und Quelle genannt werden.


Gliederung

Text

Am Beispiel einer DRG-Rechnungsprüfungssoftware wird ein Ähnlichkeitsalgorithmus für medizinische Daten vorgestellt. Grundlage ist die Überführung von medizinischen Patientendaten in einen Vektorraum und der anschliessende Vergleich mit einer Reihe von statistischen Modellen. Ein Modell wird mit einer vorhandenen Menge an Patientendaten kalkuliert.

Ziel des Algorithmus ist das Auffinden von ungewöhnlichen bzw. unplausiblen Fällen und die Anzeige der für die Unähnlichkeit verantwortlichen medizinischen Parameter (beispielsweise Diagnosen und Prozeduren).

Methoden: Medizinische Daten sind hauptsächlich symbolisch. Ein ICD-Code lässt sich nicht ohne weiteres in einen nummerischen Wert überführen. Eine Lösung ist, für jeden Code eine eigene Dimension im Vektorraum bereitzustellen. Dies bringt natürlich weitere Probleme. Ein Vektorraum kann so schnell mehr als 10'000 Dimensionen haben. Mit Hilfe von Algorithmen für dünnbesetzte Vektoren kann man die hohe Komplexität reduzieren. Alternativ kann auch eine Merkmalsreduktion mittels Clustering oder Hauptachsentransformation durchgeführt werden.

Ergebnisse: Ein möglichst repräsentativer Trainingsdatensatz wird nun beliebig gruppiert. Hierzu können Verfahren des maschinellen Lernens benutzt werden. In unserem Anwendungsbeispiel wird ein externes Kriterium, eine Gruppierung nach einer weiterentwickelten DRG-Logik (SwissDRG Version 0.3), angewandt. Für jede Gruppe wird ein Modell gebildet, welches sich im einfachsten Fall aus einem Zentrum und einer Standardabweichung zusammensetzt. Falls genügend Daten vorhanden sind und die Aufgabenstellung flexiblere Modelle erfordert, können auch komplexere Abstraktionen mit beispielsweise Mischverteilungen kalkuliert werden.

Zur Analyse wird ein Patientendatensatz mit jedem Modell verglichen, um die ähnlichsten Gruppen zu finden. Dazu wird zu jedem Modell ein Distanzmass berechnet, welches als quantitatives Mass weiter genutzt wird. Im Fall, dass ein Modell aus nur einem Zentrum besteht, ist dies mit einer einfachen euklidischen Metrik zu lösen.

Anwendungsbeispiel und Diskussion: Arbeitsplatz für die Rechnungsprüfung

Die vorgestellte Anwendung ist ein Prototyp für die DRG-Rechnungsprüfung bei Krankenkassen. Für jede DRG wird mit einer grossen Menge von Kalkulationsdaten (derzeit 300'000 Patientendatensätze) ein Modell berechnet. Bei der Analyse eines neuen Falls wird die Ähnlichkeit zu der mit einem Grouper errechneten DRG angezeigt. Zusätzlich wird der Fall mit allen anderen DRGs verglichen. Im Idealfall stimmt nun die vom Grouper errechnete DRG mit der ähnlichsten DRG überein.

Für jeden medizinischen Parameter wird zudem angezeigt, wie konsistent dieser mit der errechneten DRG übereinstimmen. So können auffällige Fallkonstellationen entdeckt werden. Es besteht die Möglichkeit in einem Batchdurchlauf eine Vorselektion von auffälligen Fällen zu machen, welche dann dem Benutzer zur weitergehenden Analyse angezeigt werden. Die manuelle Bearbeitung kann so um 45% reduziert und auf die die relevanten Fälle fokussiert werden.

Zwei weitere Anwendungsbereiche zur Prädiktion von Patientenverläufen und zur Indikationsprüfung stationärer Behandlungen sind in Evaluation.