gms | German Medical Science

67. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS), 13. Jahreskongress der Technologie- und Methodenplattform für die vernetzte medizinische Forschung e. V. (TMF)

21.08. - 25.08.2022, online

Entwicklung eines regelbasierten Algorithmus und einer Applikation zur Entscheidungsunterstützung bei der Kontrollselektion für Fall-Kontroll-Studien in großen Datenbeständen

Meeting Abstract

  • Monique Stenzel - Klinik für Anästhesiologie und Operative Intensivmedizin, Medizinische Fakultät Mannheim der Universität Heidelberg, Mannheim, Germany
  • Dennis Grimm - Verbundinformationssysteme, Deutsches Krebsforschungszentrum, Heidelberg, Germany; Komplexe Datenverarbeitung in der Medizinischen Informatik, Medizinische Fakultät Mannheim der Universität Heidelberg, Mannheim, Germany
  • Nabe Al-Hasnawi - Verbundinformationssysteme, Deutsches Krebsforschungszentrum, Heidelberg, Germany; Komplexe Datenverarbeitung in der Medizinischen Informatik, Medizinische Fakultät Mannheim der Universität Heidelberg, Mannheim, Germany
  • Martin Lablans - Verbundinformationssysteme, Deutsches Krebsforschungszentrum, Heidelberg, Germany; Komplexe Datenverarbeitung in der Medizinischen Informatik, Medizinische Fakultät Mannheim der Universität Heidelberg, Mannheim, Germany
  • Verena Schneider-Lindner - Klinik für Anästhesiologie und Operative Intensivmedizin, Medizinische Fakultät Mannheim der Universität Heidelberg, Mannheim, Germany; Department of Community Health Sciences, Max Rady College of Medicine, University of Manitoba, Winnipeg, MB, Canada

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie. 67. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS), 13. Jahreskongress der Technologie- und Methodenplattform für die vernetzte medizinische Forschung e.V. (TMF). sine loco [digital], 21.-25.08.2022. Düsseldorf: German Medical Science GMS Publishing House; 2022. DocAbstr. 136

doi: 10.3205/22gmds104, urn:nbn:de:0183-22gmds1043

Veröffentlicht: 19. August 2022

© 2022 Stenzel et al.
Dieser Artikel ist ein Open-Access-Artikel und steht unter den Lizenzbedingungen der Creative Commons Attribution 4.0 License (Namensnennung). Lizenz-Angaben siehe http://creativecommons.org/licenses/by/4.0/.


Gliederung

Text

Einleitung: Im Gegensatz zur Identifikation von Fällen, d.h. von Patienten, die einen definierten klinischen Endpunkt (Outcome, Event) aufweisen, ist die Auswahl geeigneter Patienten als Kontrollen vielfach mit Schwierigkeiten verbunden. Dies schließt das Risiko einer Verzerrung ein, was die Validität des Ergebnisses der Fall-Kontroll-Studie gefährden kann [1], [2], [3], [4]. Gerade bei vielen möglichen Kontrollen und Störgrößen wird die Kontrollselektion zur zentralen Aufgabe einer retrospektiven Studie. Unser Ziel ist die Entwicklung eines regelbasierten Algorithmus und insbesondere einer Applikation zur Entscheidungsunterstützung bei der Kontrollauswahl für Fall-Kontroll-Studien in großen Datenbeständen, die unseres Wissens aktuell nicht existiert. An der Universitätsmedizin Mannheim (UMM) wird momentan eine digitale Forschungsinfrastruktur (Digital Research Environment, DRE) am Datenintegrationszentrum (DIZ) etabliert. Die sich in Entwicklung befindliche Kontrollselektions-Applikation soll im DRE den Prozess der Kontrollselektion insbesondere mit Routinedaten der UMM vereinfachen und weniger fehleranfällig gestalten.

Stand der Technik: Derzeit wird das Matching oft mit selbst geschriebenen Programmen (z.B. in SAS oder R) oder menügesteuerter Statistiksoftware (z.B. SPSS) durchgeführt. Dies erfordert viel Zeit und Erfahrung, und kann zu inkorrekten Ergebnissen führen. In kleineren Datensätzen wird das Matching häufig sogar händisch und nicht softwaregestützt durchgeführt. Dies ist nicht nur fehleranfällig, sondern auch intransparent und schlecht reproduzierbar.

Konzept: Mit der Applikation begegnen wir dem wiederkehrenden Problem der Kontrollselektion bei Studien im DRE. Dabei werden durch das DIZ bereitgestellte oder eigene Daten genutzt. Die Applikation stellt verschiedene Matchingansätze, z.B. Matching nach ausgewählten Variablen oder Propensity-Score-Matching [5], [6], [7], bereit. Während die Applikation nicht die vorangehende Datenanalyse zur Variablenidentifikation zur Herleitung des Propensity-Score umfasst, wird der Propensity-Score anhand benutzerdefinierter Variablen berechnet. Die Applikation assistiert menügesteuert schrittweise bei der Auswahl von Matching-Variablen, Matchingverhältnis, Matching-Toleranzbereich etc., einschließlich Überprüfung des Matchingergebnisses anhand der Patientenmerkmals-Balance. Zusätzlich sollen gezielte, evidenzbasierte Informationen zu einzelnen Entscheidungsschritten im Menü die individuell korrekte Auswahl und adäquate Dokumentation des Matching-Prozesses erleichtern.

Implementierung: Für das Backend der Kontrollselektions-Applikation wird das Python Framework Django verwendet, welches Daten in einer PostgreSQL-Datenbank persistiert. Statistische Berechnungen werden in Python und R ausgeführt. Das Frontend ist mittels der JavaScript-Softwarebibliothek React in Verbindung mit Material UI realisiert. Derzeit erfolgt die Einbindung des Matchings nach ausgewählten Variablen in die Applikation, anschließend die Umsetzung des Propensity-Score-Matchings. Zukünftig wird der Zugriff auf die Kontrollselektions-Applikation browserbasiert über das DRE erfolgen, welches als Web-Applikation konzipiert wurde und Nutzer zuvor mittels OpenID Connect authentifiziert. Dabei wird auf Benutzerinformationen aus dem DFN-AAI zurückgegriffen werden, was eine institutionsübergreifende Anmeldung ermöglicht. Damit können im DRE vorliegende Gesundheitsdaten, die zuvor aus externen Quellsystemen (insb. DIZ) beantragt wurden, in die Kontrollselektions-Applikation zur Durchführung des Matchings vorgeladen werden.

Gewonnene Erkenntnisse: Unabhängig vom jeweils genutzten Datenbestand und der medizinischen Fragestellung soll die Applikation epidemiologische Expertise für methodisch anspruchsvolle, retrospektive Studien niederschwellig zur Verfügung stellen. Die Applikation wird sich durch eine einfache und komfortable Benutzerführung auszeichnen und auch gerade wenig erfahrene Forscher bei der Durchführung qualitativ hochwertiger Fall-Kontroll-Studien evidenzbasiert unterstützen. Der modulare Aufbau ermöglicht eine einfache Erweiterung, z.B. soll die Applikation zukünftig bei der Datenanalyse zur Spezifizierung des PS-Modells assistieren. Zudem kann sie nach erfolgreicher Implementierung als Open Source Lösung auch an anderen Forschungsstandorten, z.B. anderen Datenintegrationszentren, ausgerollt werden.

Die Autoren geben an, dass kein Interessenkonflikt besteht.

Die Autoren geben an, dass kein Ethikvotum erforderlich ist.


Literatur

1.
Dupepe EB, Kicielinski KP, Gordon AS, Walters BC. What is a Case-Control Study? Neurosurg. 2019;84(4):819-826. DOI: 10.1093/neuros/nyy590 Externer Link
2.
Hernán MA, Hernández-Diaz S, Robins JM. A Structural Approach to Selection Bias. Epidemiol. 2004;15(5):615-625. DOI: 10.1097/01.ede.0000135174.63482.43 Externer Link
3.
Kopec JA, Esdaile JM. Bias in case-control studies. A review. J Epidemiol Community Health. 1990;44:179-186. DOI: 10.1136/jech.44.3.179 Externer Link
4.
Rothman KJ. Modern Epidemiology. 3rd ed. Wolters Kluwer, Lippincott Williams & Wilkins; 2008.
5.
Austin PC. An Introduction to Propensity Score Methods for Reducing the Effects of Confounding in Observational Studies. Multivar Behav Res. 2011;46:399-424. DOI: 10.1080/00273171.2011.568786 Externer Link
6.
Austin PC. A comparison of 12 algorithms for matching on the propensity score. Stat Med. 2013;33:1057-1069. DOI: 10.1002/sim.6004 Externer Link
7.
Rosenbaum PR, Rubin DB. The central role of the propensity score in observational studies for causal effects. Biometrika. 1983;70:41-55. DOI: 10.1093/biomet/70.1.41 Externer Link