gms | German Medical Science

HEC 2016: Health — Exploring Complexity
2016 Joint Conference of GMDS, DGEpi, IEA-EEF, EFMI

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V.
Deutsche Gesellschaft für Epidemiologie e. V.

28.08. - 02.09.2016, München

Analyse der Datenqualität der papierbasierten Erhebung für ein bundesweites Register in der Kinderrheumatologie

Meeting Abstract

  • Lennart Köster - University of Heidelberg, Heidelberg, Deutschland
  • Nils Geisemeyer - German Rheumatism Research Centre Berlin, Berlin, Deutschland
  • Martina Niewerth - German Rheumatism Research Centre Berlin, Berlin, Deutschland
  • Kirsten Minden - German Rheumatism Research Centre Berlin, Berlin, Deutschland
  • Kai Krupka - Department of Pediatrics I, University Children’s Hospital, Heidelberg, Heidelberg, Deutschland
  • Britta Höcker - Department of Pediatrics I, University Children’s Hospital, Heidelberg, Heidelberg, Deutschland
  • Burkhard Tönshoff - Department of Pediatrics I, University Children’s Hospital, Heidelberg, Heidelberg, Deutschland
  • Petra Knaup - University of Heidelberg, Heidelberg, Deutschland

HEC 2016: Health – Exploring Complexity. Joint Conference of GMDS, DGEpi, IEA-EEF, EFMI. München, 28.08.-02.09.2016. Düsseldorf: German Medical Science GMS Publishing House; 2016. DocAbstr. 625

doi: 10.3205/16gmds155, urn:nbn:de:0183-16gmds1553

Published: August 8, 2016

© 2016 Köster et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License. See license information at http://creativecommons.org/licenses/by/4.0/.


Outline

Text

Das Deutsche Rheuma-Forschungszentrums Berlin (DRFZ) betreibt eine Kerndokumentation für ein bundesweites, pädiatrisches Rheumaregister. Dieses wird derzeit auf eine elektronische Version mit Namen KRhOKo umgestellt. Über eine Webplattform werden Arzt-, Eltern- und Jugendlichenfragebögen künftig über das Internet angeboten. In der Übergangszeit sollen Daten auf Papier durch eine Import-Funktion in das Onlineregister eingepflegt werden. Während die Daten bei der Onlineerhebung direkt gegen Validierungsregeln überprüft werden können und kein Medienbruch bei der Erhebung vorliegt, werden die auf Papier erhobenen Daten zunächst digitalisiert bevor sie in das Register importiert werden. Die Digitalisierung erfolgt durch eine externe Firma, welche die Daten in einem ASCII-Format an das DRFZ schickt, in dem jeder Antwortmöglichkeit des Fragebogens ein Index im ASCII-Format zugewiesen ist. Arztbögen besitzen 280 Indizes, Elternbögen 248 und Jugendlichenbögen 223. Gegenüber der direkten Eingabe in das Onlineregister können während des Digitalisierungsvorgangs zusätzliche Fehler auftreten. Fragestellung dieser Arbeit ist, wie gut die Qualität der Digitalisierung hinsichtlich ihrer Übereinstimmung mit den Originaldaten ist und eine Erprobung, inwieweit die Validierungsregeln der neuen Onlineerhebung Fehler beim Ausfüllen der Bögen durch Ärzte und Patienten verhindern können. Eine weitere Forschungsfrage ist, ob die Erkrankten selbst oder Ihre Eltern die Fragebögen gewissenhafter ausfüllen, um bei der Onlineerhebung spezifische Hinweise oder Hilfestellungen für die Benutzergruppen anbieten zu können, um die Vollständigkeit der Fragebogen möglichst hoch zu halten. Daher wurden zufällig jeweils 80 Arzt-, und Jugendlichen- sowie 81 Elternbögen aus 11706 Fragebögen ausgewählt. Die Papierversion und die digitalisierte Version dieser Fragebögen werden systematisch verglichen. Zusätzlich wird das Ergebnis der Digitalisierung mittels der Validierungsregeln der neuen Onlineerhebung überprüft. Zusätzlich wurde die Vollständigkeit der Eltern- und Jugendlichenbögen erfasst. Von 80 Arztbögen wiesen sechs Fragebögen vereinzelte Digitalisierungsfehler auf: Werte wurden falsch übertragen oder nicht übernommen. Bei den Elternbögen waren von diesen Fehlern 18 Fragebögen betroffen, bei den Jugendlichenbögen 17. Die Fehleranzahl schwankte von einem bis zu fünf fehlerhaften Feldern pro Fragebogen. Die Validierung der 80 Arztbögen zeigte, dass 14 Fragebögen die neuen Validierungsregeln verletzten. Hauptfehlergrund waren fehlende Werte, lediglich in drei Fällen führten Transkriptionsfehler in der digitalisierten Version des Fragebogens zu Validierungsfehlern. Häufigste Fehlerursache bei Validierungsfehlern der zwölf fehlerhaften Elternbögen fehlende Werte (11 Fehler) gefolgt von widersprüchlichen Angaben (6 Fehler). Ein Beispiel ist die Angabe, dass keine Schule besucht wurde, aber dennoch am Schulsport teilgenommen wurde. Bei den sieben fehlerhaften Jugendlichenbögen wiederholte sich dieses Bild mit 8 Fehlern zu fehlenden Werten und 3 zu Widersprüchen. Der Vergleich der Vollständigkeit zwischen Eltern- und Jugendlichenbögen zeigte, dass Elternbögen im Durchschnitt zu 92.2% vollständig sind während die Jugendlichenbögen im Durchschnitt zu 97.2% vollständig sind. Anhand der Analyse des Digitalisierungsprozesses kann davon ausgegangen werden, dass die importierten Daten von wenigen Fehlern betroffen sein werden. Fehler, die zu validen Merkmalsausprägungen führen, lassen sich nur durch einen manuellen Vergleich der Papierbögen und der elektronischen Bögen finden. Die aufgetretenen Validierungsfehler wären bei einer elektronischen Eingabe vermieden worden, entsprechend verbessern die neuen Validierungsregeln direkt die Datenqualität der elektronischen Erhebung. Durch gesonderte Hinweise und Unterstützungen bei der Eingabe sollte versucht werden, die Vollständigkeit der Elternbögen zu erhöhen.