gms | German Medical Science

63. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie

02. - 06.09.2018, Osnabrück

Maschinelles Lernen zur optimierten zweckabhängigen Messung von Datenqualität

Meeting Abstract

Suche in Medline nach

  • Erik Tute - Peter L. Reichertz Institut für Medizinische Informatik der Technischen Universität Braunschweig und der Medizinischen Hochschule Hannover, Braunschweig, Deutschland

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie. 63. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS). Osnabrück, 02.-06.09.2018. Düsseldorf: German Medical Science GMS Publishing House; 2018. DocAbstr. 116

doi: 10.3205/18gmds160, urn:nbn:de:0183-18gmds1603

Veröffentlicht: 27. August 2018

© 2018 Tute.
Dieser Artikel ist ein Open-Access-Artikel und steht unter den Lizenzbedingungen der Creative Commons Attribution 4.0 License (Namensnennung). Lizenz-Angaben siehe http://creativecommons.org/licenses/by/4.0/.


Gliederung

Text

Hintergrund: Die im Rahmen der Medizininformatik-Initiative geplanten Datenintegrationszentren, sollen den Austausch und die intelligente Nutzung von Daten aus Versorgung und Forschung unterstützen. Die zweckabhängige Nutzbarkeit von Daten wird als ihre Datenqualität (DQ) bezeichnet. DQ-Messwerkzeuge können auch helfen Fehler in der Datenintegration aufzuzeigen [1], [2]. Für Gesundheitsdaten fehlen etablierte Messverfahren und Referenzwerte zur Bewertung von DQ-Messergebnissen [1], [3]. Die Auswahl, Gewichtung und Ergebnisbewertung von DQ-Messmethoden in DQ-Messwerkzeugen für Gesundheitsdaten geschieht meist zweckunabhängig und auf Erfahrungswissen von Experten basierend.

Ziel der Studie: Ziel der beschriebenen Arbeiten ist multi-institutionelles maschinelles Lernen optimierter Kombinationen von DQ-Messmethoden. Dies soll Erfahrungswissen objektivieren und multi-institutionell nutzbar machen. Die zweckabhängige Optimierung der Kombinationen soll Fehler bei der Datenintegration besser aufzeigen und die Datenqualität besser bewerten, als zweckunabhängige Festlegungen.

Das Abstrakt geht aus platzgründen nicht auf die zweifellos nötige Evaluation der gelernten Kombinationen ein.

Vorgeschlagene Methode: Die Messergebnisse eines regel- und modellbasierten DQ-Messwerkzeugs, mit Datenzugriff über standardisierte Schnittstellen (openEHR), das in HiGHmed-Konsortium-kompatiblen Datenintegrationszentren eingesetzt werden kann, sollen für das maschinelle Lernen genutzt werden.

Die Lernaufgabe kann als Sequenz binärer Klassifikationen unterschiedlicher DQ-Probleme betrachtet werden. Input Variablen sind DQ-Messergebnisse, Zielvariable ist die Existenz des DQ-Problems im Datensatz. Für jedes unterschiedliche Tupel (DQ-Messmethodenmenge, Aufgabe, klinisches Informationsmodell, DQ-Problem) ist zu optimieren, wie DQ-Messmethoden unter Berücksichtigung ihres Messergebnisses gewichtet und wie unterschiedliche Merkmale bei Aggregationen innerhalb einzelner Messmethoden gewichtet werden. Dabei wird eine Betrachtung einer DQ-Eigenschaft (z.B. Vollständigkeit, Korrektheit) über eine andere Dimension (z.B. Merkmal, Patient, Zeitpunkt) als neue DQ-Messmethode betrachtet (vergl. [4]). Aufgaben könnten das Aufzeigen von Datenintegrationsfehlern sein oder der Zweck, für den die Datenqualität bewertet wird. Ein einfaches DQ-Problem wäre ein zu hoher Anteil an Null-Werten in einem Merkmal.

Die Umsetzung ist pragmatisch geplant: Weil noch kein Trainingsdatensatz vorhanden ist und davon auszugehen ist, dass auch nicht optimierte DQ-Messergebnisse bereits helfen, DQ-Probleme zu erkennen, erhält der Nutzer DQ-Messergebnisse zu einem Datensatz und untersucht diesen weitergehend. Danach indexiert er DQ-Probleme im Datensatz in Bezug auf die Aufgabe. Eine optionale Angabe welche DQ-Messergebnisse Hinweise auf welches DQ-Problem geben, zielt auf eine verbesserte Optimierung trotz mittelfristig absehbar kleiner Trainingsdatenmenge (eine Instanz in Trainingsdatenmenge = DQ-Messergebnisse für Datensatz und zugehörige, aufgaben- und informationsmodellabhängige Bewertung ob DQ-Problem vorhanden ist).

Messergebnisse der DQ-Messmethoden werden auf den Wertebereich [0,1] genormt. Die Aggregation innerhalb der DQ-Messmethoden erfolgt durch gewichtete Mittelwerte. Dadurch reichen in den zum Lernen nötigen Instanz-Daten, die Summen bestimmter Teilergebnisse innerhalb der Messmethoden aus, anstatt der gesamten Gesundheitsdaten. Die nötigen Teilergebnisse ergeben sich aus den DQ-Messmethoden und dem Informationsmodell. Diese Reduktion der Instanz-Daten ist insbesondere für einrichtungsübergreifendes Lernen relevant (Datenschutz und Datenmenge).

Die grundsätzliche Erprobung des maschinellen Lernens soll zunächst mit etablierten Methoden (Bäume, Support Vector Machines) existierender Werkzeuge erfolgen.

Diskussionspunkte: Es ist absehbar, dass die Anzahl an Instanzen mittelfristig niedrig sein wird, auch wenn der Ansatz multi-institutionelles Lernen an mehreren Datenintegrationszentren ermöglicht. Eine Anwendung der Lernmethode auf Ergebnisse von DQ-Messwerkzeugen deren Implementierung auf anderen Standards basiert (z.B. HL7 CDA, OMOP) erscheint möglich, solange die DQ-Messmethoden und klinischen Informationsmodelle semantisch äquivalent sind. Ebenso wäre ein vom Zweck oder auch vom klinischen Informationsmodell unabhängiges Lernen vorstellbar.

Die Autoren geben an, dass kein Interessenkonflikt besteht.

Die Autoren geben an, dass kein Ethikvotum erforderlich ist.


Literatur

1.
Khare R, Utidjian L, Ruth BJ, Kahn MG, Burrows E, Marsolo K, Patibandla N, Razzaghi H, Colvin R, Ranade D, Kitzmiller M, Eckrich D, Bailey LC. A longitudinal analysis of data quality in a large pediatric data research network. J Am Med Inform Assoc. 2017 Nov 1;24(6):1072-1079. DOI: 10.1093/jamia/ocx033 Externer Link
2.
Walker KL, Kirillova O, Gillespie SE, Hsiao D, Pishchalenko V, Pai AK, Puro JE, Plumley R, Kudyakov R, Hu W, Allisany A, McBurnie M, Kurtz SE, Hazlehurst BL. Using the CER Hub to ensure data quality in a multi-institution smoking cessation study. J Am Med Inform Assoc. 2014 Nov-Dec;21(6):1129-35. DOI: 10.1136/amiajnl-2013-002629 Externer Link
3.
Huser V, DeFalco FJ, Schuemie M, Ryan PB, Shang N, Velez M, Park RW, Boyce RD, Duke J, Khare R, Utidjian L, Bailey C. Multisite Evaluation of a Data Quality Tool for Patient-Level Clinical Data Sets. EGEMS (Wash DC). 2016 Nov 30;4(1):1239. DOI: 10.13063/2327-9214.1239 Externer Link
4.
Weiskopf NG, Weng C. Methods and dimensions of electronic health record data quality assessment: enabling reuse for clinical research. J Am Med Inform Assoc. 2013 Jan 1;20(1):144-51. DOI: 10.1136/amiajnl-2011-000681 Externer Link