gms | German Medical Science

65th Annual Meeting of the German Association for Medical Informatics, Biometry and Epidemiology (GMDS), Meeting of the Central European Network (CEN: German Region, Austro-Swiss Region and Polish Region) of the International Biometric Society (IBS)

06.09. - 09.09.2020, Berlin (online conference)

Validierung des DIFUTURE-Treatment Decision Scores für Patienten mit Multipler Sklerose auf Basis verteilter Daten – eine Machbarkeitsstudie mit DataSHIELD

Meeting Abstract

Suche in Medline nach

  • Stefan Buchka - Institut für medizinische Informationsverarbeitung, Biometrie und Epidemiologie der LMU München, München, Germany
  • Daniel Schalk - Statistisches Institut der LMU München, München, Germany
  • Guokun Zhang - Institut für medizinische Informationsverarbeitung, Biometrie und Epidemiologie der LMU München, München, Germany
  • Verena Sophia Hoffmann - Institut für medizinische Informationsverarbeitung, Biometrie und Epidemiologie der LMU München, München, Germany

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie. 65th Annual Meeting of the German Association for Medical Informatics, Biometry and Epidemiology (GMDS), Meeting of the Central European Network (CEN: German Region, Austro-Swiss Region and Polish Region) of the International Biometric Society (IBS). Berlin, 06.-09.09.2020. Düsseldorf: German Medical Science GMS Publishing House; 2021. DocAbstr. 472

doi: 10.3205/20gmds241, urn:nbn:de:0183-20gmds2411

Veröffentlicht: 26. Februar 2021

© 2021 Buchka et al.
Dieser Artikel ist ein Open-Access-Artikel und steht unter den Lizenzbedingungen der Creative Commons Attribution 4.0 License (Namensnennung). Lizenz-Angaben siehe http://creativecommons.org/licenses/by/4.0/.


Gliederung

Text

Data Integration for Future Medicine (DIFUTURE) ist ein vom Bundesministerium für Bildung und Forschung unterstütztes Konsortium, welches das Ziel hat, die Datenqualität, -verfügbarkeit und -integration zu verbessern. Bei DIFUTURE arbeiten Wissenschaftler und Ärzte Hand in Hand, um die Situation von Patienten mit verschiedenen Krankheiten durch die neu gewonnenen, hoch qualitativen Daten zu verbessern. Eine der untersuchten Krankheiten ist dabei Multiple Sklerose. Hierbei werden die Daten nicht nur zum besseren Verständnis dieser unheilbaren Krankheit verwendet, sondern auch, um Algorithmen zu entwickeln, die den Verlauf der Krankheit auf individueller Ebene vorhersagen können, um eine optimale Medikation für jeden Patienten zu finden.

Dazu wird im DIFUTURE Konsortium zum Thema Multiple Sklerose eine prospektive, multizentrische Beobachtungsstudie durchgeführt (ProVal) bei der ein auf retrospektiven Daten basierender Treatment Decision Score validiert werden soll.

Der Score wird aus zu Therapiebeginn vorliegenden Merkmalen von Patienten berechnet und soll eine Prädiktion des Therapieerfolges nach 24 Monaten ermöglichen. Für die Bewertung der Güte des Treatment Decision Scores wird die Fläche unter der Receiver Operating Characteristics (AUROC) verwendet.

Um die AUROC für den Treatment Decision Score zu berechnen, wird der tatsächliche individuelle Therapieverlauf der Patienten benötigt. Diese sensiblen Daten unterliegen der Datenschutz-Grundverordnung und dürfen daher die Studienzentren der ProVal-Studie nicht verlassen. Ziel des Projektes ist es dennoch für die beschriebene Datensituation die AUROC zu berechnen. Dafür haben wir ein Verfahren entwickelt und implementiert, welches es erlaubt die AUROC auf verteilten Daten zu berechnen. Hierbei wird auf das ROC-GLM [1] Verfahren zurückgegriffen. Die Verwendung des ROC-GLMs bietet den entscheidenden Vorteil, dass die zugrundeliegende Probit-Regression basierend auf den verteilten Daten berechnet werden kann, ohne dass personenbezogene Daten eines der Zentren verlassen müssen. Der entwickelte Algorithmus bietet demnach kompletten Schutz der Privatsphäre der Patienten und gibt dem Analysten die Sicherheit einer präzisen AUROC Berechnung. Neben der Entwicklung der Methodik spielt auch die Implementierung eine wesentliche Rolle. Die Infrastruktur dazu muss zuverlässig sein und eine sichere Analyse zwischen den Zentren erlauben.

Unsere Wahl für eine solche Infrastruktur ist die datenschutzkonforme Software DataSHIELD [2], welche mittels der statistischen Software R [3] die Analyse-Skripte an den jeweiligen Speicherorten der medizinischen Individualdaten ausführt und gewünschte Analyseergebnisse in aggregierter Form zurück schickt. Dabei ist es nicht mehr möglich Rückschlüsse auf individuelle Patientendaten zu ziehen. Neben der Implementierung der Methodik zur Evaluation des Treatment Decision Scores bietet DataSHIELD noch weitere Vorteile wie die Durchführung einfacher deskriptiver Analysen mit den dezentral gelagerten Daten. Die ProVal Studie kann dabei stark von DataSHIELD als Infrastruktur für verteilte Datenanalysen profitieren.

Das Ergebnis des Projekts ist demnach die Bereitstellung einer Infrastruktur, mit welcher es möglich ist, Analysen mit allen Daten durchzuführen. Zusätzlich wird diese Software verwendet, um die Güte des Treatment Decision Score im Rahmen der ProVal Studie zu evaluieren. Die Ergebnisse der zu DataSHIELD aktuell durchgeführten Machbarkeitsstudie, sowie die Ergebnisse der Validierung des ROC-GLM mit simulierten Daten werden präsentiert.

Die Autoren geben an, dass kein Interessenkonflikt besteht.

Die Autoren geben an, dass ein positives Ethikvotum vorliegt.


Literatur

1.
Pepe MS. An interpretation for the ROC curve and inference using GLM procedures. Biometrics. 2000 Jun;56(2):352-9. DOI: 10.1111/j.0006-341x.2000.00352.x Externer Link
2.
Wolfson M, Wallace SE, Masca N, Rowe G, Sheehan NA, Ferretti V, LaFlamme P, Tobin MD, Macleod J, Little J, Fortier I, Knoppers BM, Burton PR. DataSHIELD: resolving a conflict in contemporary bioscience – performing a pooled analysis of individual-level data without sharing the data. Int J Epidemiol. 2010 Oct;39(5):1372-82. DOI: 10.1093/ije/dyq111 Externer Link
3.
R Core Team. R: A language and environment for statistical computing. Vienna, Austria: R Foundation for Statistical Computing; 2013. Available from: http://www.R-project.org/ Externer Link