Article
Qualitätsvergleiche der katheterinterventionellen Versorgung bei PAVK: Die Data Science Pipeline von RECCORD
Search Medline for
Authors
Published: | October 2, 2023 |
---|
Outline
Text
Hintergrund und Stand der Forschung: Mit dem multizentrischen Register RECCORD verfolgt die Deutsche Gesellschaft für Angiologie das Ziel, die katheterinterventionelle Versorgung bei PAVK zu verbessern [1]. Qualitätsvergleiche der Zentren ergänzen die Ermittlung qualitätsrelevanter Ergebnisse auf nationaler Ebene. Umfeld der Intervention und Outcome nach einem Jahr betrachten 7 Qualitätsindikatoren.
Fragestellung und Zielsetzung, Hypothese: Die Auswertung versorgungsnaher Daten ist mit besonderen Komplexitäten konfrontiert. Register streben eine realistische Abbildung der Versorgung mit vielfältigen Phänomenen an. Möglichkeiten zur Kontrolle von Datenerhebung und -erfassung sind begrenzt. Im Datenbestand treten daher häufig unerwartete Konstellationen auf. Zielsetzung des Beitrags ist die prototypische Darstellung der Data Science Pipeline von RECCORD. Hypothese ist, dass bei Registern spezifische Verfahren zur Nutzung versorgungsnaher Daten erforderlich sind.
Methode: Die Data Science Pipeline startet mit einem Export aus dem EDC-System. Die nachfolgende Transformation zur weiteren Nutzung der Daten erfolgt in einem Datenbanksystem (RDBMS). Die Transformation umfasst u.a. die Konvertierung von Datentypen, die Auflösung zusammengesetzter Felder, die Rekonstruktion des sachbezogenen Merkmalskatalogs aus einer Visit-orientierten Erfassung sowie die Identifikation interessierender Ereignisse.
Ergebnisse: Die Ergebnisse zu den Qualitätsindikatoren werden für die jährlichen Qualitätsvergleiche aus einem Gesamtexport berechnet. Der Qualitätsbericht 2021/2022 wird erstmals einen longitudinalen Vergleich über mehrere Jahre beinhalten. Für statistische Analysen werden vorbereitete Daten aus dem RDBMS in ein Statistikpaket geladen.
Diskussion: Im Mittelpunkt der Data Science Pipeline von RECCORD steht ein gängiges RDBMS zur Transformation, Auswertung und Bereitstellung von Daten. Diese Architektur schafft Flexibilität bei Auswertungen und bietet Unabhängigkeit von EDC-System und Statistikpaket. Alternativ werden in der Literatur sowohl Lösungen mit Betonung des Statistikpakets (z.B. mit R [2]) als auch mit Betonung des EDC-Systems (z.B. mit REDCap [3]) diskutiert. Offen ist, ob frei verfügbare Werkzeuge eine selbstentwickelte Lösung ersetzen können [4].
Implikation für die Forschung: Es fehlen Empfehlungen zur Umsetzung einer Data Science Pipeline bei Registern. Ein separates Werkzeug zur Transformation und Aufbereitung versorgungsnaher Daten kann Vorteile in Flexibilität und Unabhängigkeit bieten.
Literatur
- 1.
- M Malyar N, Stausberg J, Ito WD, Kölble H, Langhoff R, Lawall H, Lichtenberg M, Stegemann J, Treitl M, Weiss N, Hoffmann U. Rationale and design of the RECording COurses of vasculaR Diseases registry (RECCORD registry). Vasa. 2017 Jul;46(4):262-7. DOI: 10.1024/0301-1526/a000631
- 2.
- Hussain W, Anumalla M, Catolos M, Khanna A, Sta Cruz MT, Ramos J, Bhosale S. Open-source analytical pipeline for robust data analysis, visualizations and sharing in crop breeding. Plant Methods. 2022 Feb 5;18(1):14. DOI: 10.1186/s13007-022-00845-7
- 3.
- Rovera G, Fariselli P, Deandreis D. Development of a REDCap-based workflow for high-volume relational data analysis on real-time data in a medical department using open source software. Comput Methods Programs Biomed. 2022 Nov;226:107111. DOI: 10.1016/j.cmpb.2022.107111
- 4.
- Ye Y, Barapatre S, Davis MK, Elliston KO, Davatzikos C, Fedorov A, Fillion-Robin JC, Foster I, Gilbertson JR, Lasso A, Miller JV, Morgan M, Pieper S, Raumann BE, Sarachan BD, Savova G, Silverstein JC, Taylor DP, Zelnis JB, Zhang GQ, Cuticchia J, Becich MJ. Open-source Software Sustainability Models: Initial White Paper From the Informatics Technology for Cancer Research Sustainability and Industry Partnership Working Group. J Med Internet Res. 2021 Dec 2;23(12):e20028. DOI: 10.2196/20028