gms | German Medical Science

18. Deutscher Kongress für Versorgungsforschung

Deutsches Netzwerk Versorgungsforschung e. V.

09. - 11.10.2019, Berlin

Umgang mit Big Data anhand der Studie ‚Determinanten freiheitsentziehender Maßnahmen (DeFEM)‘ bei stationärer Behandlung

Meeting Abstract

Suche in Medline nach

  • Olaf Karasch - Landschaftsverband Rheinland, Institut für Versorgungsforschung, Köln, Germany

18. Deutscher Kongress für Versorgungsforschung (DKVF). Berlin, 09.-11.10.2019. Düsseldorf: German Medical Science GMS Publishing House; 2019. Doc19dkvf200

doi: 10.3205/19dkvf200, urn:nbn:de:0183-19dkvf2000

Veröffentlicht: 2. Oktober 2019

© 2019 Karasch.
Dieser Artikel ist ein Open-Access-Artikel und steht unter den Lizenzbedingungen der Creative Commons Attribution 4.0 License (Namensnennung). Lizenz-Angaben siehe http://creativecommons.org/licenses/by/4.0/.


Gliederung

Text

Hintergrund: Die Anwendung von Zwangsmaßnahmen (einschließlich Zwangseinweisungen und -behandlungen nach PsychKG) gilt in der Psychiatrie als äußerstes Mittel und soll soweit wie möglich vermieden werden. Ein Ansatz zur Verringerung der Häufigkeit von Zwangseinweisungen ist die Entwicklung und Anwendung von Präventivmaßnahmen durch die Identifizierung von Risikofaktoren. Im Vorfeld der Studie wurden deskriptive Analysen mit allen an der Studie teilnehmenden sektorversorgenden Kliniken des untersuchten Versorgungsgebiets durchgeführt sowie ein intuitiv verständlicher Maschinenlernen-Algorithmus (exhaustive CHAID; Chi-squared Automatic Interaction Detection) auf das Datenset (N=5.764) angewandt.

Fragestellung: Welche Risikofaktoren zur Einweisung und Behandlung gegen den Willen eines Patienten können durch die Anwendung von Maschinenlernen-Methoden identifiziert werden?

Wie lassen sich die Unterschiede zwischen den Raten und Quoten der Zwangsbehandlungen nach PsychKG der sektorversorgenden Kliniken erklären?

Methode: Diese Studie zieht als Follow-Up zu ersten bereits publizierten Ergebnissen Vergleiche zwischen den Kliniken im Erhebungsgebiet, wobei die Klassifizierungsrate der PsychKG vs. freiwilligen Einweisungen unter Einbezug weiterer Variablen und Methoden des Maschinenlernens maximiert wurde. Um die Fragestellungen zu beantworten wurden retrospektiv medizinische, soziodemographische und sozioökonomische Routinedaten der Patienten erhoben. Der Datensatz wurde mit zusätzlichen sozioökonomischen Variablen des Umfelds (wie Kaufkraft und Anzahl der Erwerbstätigen) auf PLZ-Ebene verknüpft.

Die Anwendung des Maschinenlernens umfasst vier Arbeitsschritte: (1) Feature (unabhängige Variable) Selektion, (2) Auswahl verschiedener Algorithmenklassen, (3) Hyperparameter Tuning und die (4) finale Auswahl des besten Algorithmus anhand der besten Prädiktion des Validierungssets. Der gesamte Prozess wurde in Python geskriptet u.a. mit dem Paket Scikit-Learn.

Ergebnisse: Die CHAID Analyse identifizierte die Hauptdiagnose als stärksten Prädiktor. Weitere durch CHAID identifizierte Faktoren sind eine fehlende ambulante Versorgung vor dem Klinikaufenthalt, eine Einweisung außerhalb regulärer Dienstzeiten sowie ein vorhandener Migrationshintergrund. Bei den unfreiwilligen Fällen war die Frage nach der einweisenden Instanz entscheidend für die Unterschiede zwischen den sektorversorgenden Kliniken.

Die Ergebnisse der Verknüpfung mit den Umfeldvariablen im Rahmen des Maschinenlernens steht noch aus. Die Auswertung des Maschinenlernens wird sich auf die Gewichtung der Prädiktoren innerhalb der am besten klassifizierenden Modelle beziehen. Diese werden innerhalb der Anwendung diskutiert sowie mit den Ergebnissen der CHAID Analyse verglichen.

Diskussion: Der Einsatz von Algorithmen des Maschinenlernens stellt einen vielversprechenden Ansatz dar, um große Datenmengen aus einer Vielzahl von (meist kategorial vorliegenden) Daten zu analysieren und in für die Praxis relevante Modelle zu überführen. Die vorliegende Studie identifiziert robuste Prädiktoren für Risikogruppen unfreiwilliger Behandlungen. Zusätzlich werden verschiedene Algorithmen des Maschinenlernens erläutert, mit dem Ziel, die prädiktive Kraft zu maximieren und die erklärte Varianz zu steigern. Dies lässt Rückschlüsse auf die Notwendigkeit des Einschlusses weiterer Variablen in zukünftigen Erhebungen zu. Es wurde ebenfalls eine Einschätzung des Einflusses sozioökonomischer Parameter des Umfelds eines Patienten vorgenommen. Zusätzlich werden im Beitrag Vorgehensweisen im Umgang mit gesundheitsbezogenen Datensets in Bezug auf Anwendungen aus dem Bereich Maschinenlernen/Big Data diskutiert (z.B. Evaluationsmetrik bei nicht balancierten Datensets).

Praktische Implikationen: Aus den Ergebnissen dieser Studie werden Implikationen im Bereich Methodologie und Interventionen abgeleitet. Spezifisch bietet die Erweiterung bestehender Datensets mit routinemäßig erhobenen Daten des Umfelds eine einfach umzusetzende Möglichkeit, die prädiktive Genauigkeit von bisherigen statistischen Modellen zu erhöhen. Dies könnte eine Vielzahl von Analysen in der Versorgungsforschung verbessern. Letztlich können weitere Ansätze zur Intervention und Prävention von Zwangseinweisungen und -behandlungen anhand der identifizierten Prädiktoren abgeleitet und entwickelt werden.