gms | German Medical Science

GMDS 2013: 58. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie

01. - 05.09.2013, Lübeck

Krankheitskostenstudien auf Basis sehr großer Datenmengen: Relevanz der numerischen Effizienz eines innovativen Designs

Meeting Abstract

  • Björn Stollenwerk - Helmholtz Zentrum München, Neuherberg/München, DE
  • Thomas Welchowski - Helmholtz Zentrum München, Neuherberg/München, DE
  • Stephanie Stock - Universitätsklinikum Köln, AöR, Cologne, DE

GMDS 2013. 58. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS). Lübeck, 01.-05.09.2013. Düsseldorf: German Medical Science GMS Publishing House; 2013. DocAbstr.46

doi: 10.3205/13gmds185, urn:nbn:de:0183-13gmds1858

Published: August 27, 2013

© 2013 Stollenwerk et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution License (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en). You are free: to Share – to copy, distribute and transmit the work, provided the original author and source are credited.


Outline

Text

Im Gesundheitssektor fallen immer größere Mengen Routinedaten an. Diese stehen häufig auch für wissenschaftliche Analysen zur Verfügung. Dennoch wurde bislang kein spezielles Design entwickelt, um Krankheitskostenstudien auf Basis sehr großer Datenmengen durchzuführen. Wir präsentieren solch ein Design. Dieses zeichnet sich durch einen vergleichsweise geringen Informationsverlust aus. Darüber hinaus ist es numerisch effizienter als etablierte Methoden.

Die innovative Methode besteht aus fünf Schritten: Datenaggregation, Anpassung eines generalisierten additiven Modells (GAM), Kostenprädiktion, Vergleich prädizierter Kosten zwischen einer prävalenten und einer nicht prävalenten Population, Quantifizierung der stochastischen Unsicherheit via des Fehlerfortpflanzungsgesetzes.

Zur Demonstration der Methode, und um abzuschätzen, inwiefern der numerische Effizienzgewinn von praktischer Relevanz ist, wurde die innovative Methode auf einen Datensatz von 7,3 Millionen gesetzlich Krankenversicherten angewendet. Der numerische Aufwand war bei der innovativen Methode verhältnismäßig gering (19 Minuten Rechendauer). Bei Verzicht auf den Datenaggregationsprozess stieg nicht nur der Rechenaufwand exponentiell an; auch das Risiko, dass die Schätzung der Regressionsparameter fehlschlägt, war mit der Größe des Datensatzes assoziiert (80% bei einem GAM auf Basis von 6 Millionen Versicherten).

Der numerische Effizienzgewinn der empfohlenen Methodik zur Durchführung von Krankheitskostenstudien scheint von praktischer Relevanz zu sein. Darüber hinaus gewährleistet die innovative Methode eine effiziente Nutzung der verfügbaren Informationen.