gms | German Medical Science

32. Jahrestagung der Retinologischen Gesellschaft

Retinologische Gesellschaft

28.06. - 29.06.2019, Ludwigshafen

Datenerhebung aus elektronischen Patientenakten mittels Text-Mining

Meeting Abstract

  • Matthias Gutfleisch - Münster
  • K. Rothaus - Münster
  • O. Ester - Westphalia DataLab GmbH, Münster
  • M.-L. Farecki - Münster
  • M. Ziegler - Münster
  • A. Lommatzsch - Münster; Essen
  • R. Kurzhals - Westphalia DataLab GmbH, Münster
  • D. Pauleikhoff - Münster; Essen

Retinologische Gesellschaft. 32. Jahrestagung der Retinologischen Gesellschaft. Ludwigshafen, 28.-29.06.2019. Düsseldorf: German Medical Science GMS Publishing House; 2019. Doc19rg11

doi: 10.3205/19rg11, urn:nbn:de:0183-19rg112

Veröffentlicht: 5. August 2019

© 2019 Gutfleisch et al.
Dieser Artikel ist ein Open-Access-Artikel und steht unter den Lizenzbedingungen der Creative Commons Attribution 4.0 License (Namensnennung). Lizenz-Angaben siehe http://creativecommons.org/licenses/by/4.0/.


Gliederung

Text

Hintergrund: Die Erhebung von Patientendaten aus elektronisch geführten Patientenakten in einigen Fällen teilstrukturiert (Visus, Injektionsfrequenz) aber in aller Regel unstrukturiert (Freitext) vor. Die Erhebung dieser Daten ist sowohl für interne Qualitätsanalyse als auch für externe Nutzung z.B. zur Analyse von Versorgungsdaten von großem Interesse. Ziel der vorliegenden Studie war es, eine Methode zu entwickeln, um patientenbezogene Daten, die in verschiedenen Datenbanken strukturiert, teilstrukturiert oder unstrukturiert vorlagen, als regelbasierte strukturierte Informationen seitenrichtig zu extrahieren und die erhaltenen Daten in Bezug auf ihre Qualität zu evaluieren.

Methoden: Mit einem Kooperationspartner (Westphalia DataLab, Münster) wurde mittels einer Textmining-Modellierungssprache eine Software entwickelt, die aus verschiedenen Datenbanken des Augenzentrums personen- und terminbezogenen Informationen bei AMD-Patienten mit einer IVOM-Therapie extrahierte. Bei der Auswertung von Freitextfeldern wurden Fachausdrücke und Seitenlokalisationen identifiziert. Nach manuellem Labeln wurde der Datensatz in einen Trainings- und einen Testdatensatz aufgeteilt. Die automatisierte Identifikation der Augenseite wurde unter Entwicklung von Regeln der automatisierten Zuordnung eines Terms zu einer Seite durchgeführt und iterativ verbessert. Die Größe des Testdaten wurde statistisch so abgeschätzt, dass die Konfidenzintervalle der Schätzer für Genauigkeit und Empfindlichkeit mit einem Signifikanzniveau von 0,99 abgesichert waren.

Ergebnisse: Die Auswertung des Trainingsdatensatzes ergab für die klinischen Informationen und die Seitenlokalisation eine Genauigkeit von 0,97 und Empfindlichkeit von 0,96. Die Testdatensatzauswertung zeigte für die gleichen Regeln eine leicht geringere Genauigkeit (-0,03), während die Empfindlichkeit leicht Anstieg (+0,01).

Schlussfolgerungen: Mit Hilfe von regelbasiertem Text-Mining lassen sich auch aus unstrukturierten Freitext-Feldern strukturierte Informationen z.B. über die IVOM-Therapie bei AMD-Patienten erheben. Dies ist die Basis, um automatisiert große Datenmengen aus elektronischen Klinik-/Praxisdatenbanken relevante Daten z.B. für interne Qualitätsanalysen und externe Projekte der Versorgungsforschung zu erheben und zu analysieren.