gms | German Medical Science

HEC 2016: Health — Exploring Complexity
2016 Joint Conference of GMDS, DGEpi, IEA-EEF, EFMI

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V.
Deutsche Gesellschaft für Epidemiologie e. V.

28.08. - 02.09.2016, München

Goldstandardvergleich eines neuen Verfahrens zum Record-Linkage des Krebsregisters Rheinland-Pfalz

Meeting Abstract

Search Medline for

  • Katharina Emrich - Cancer Registry Rhineland-Palatinate (Krebsregister Rheinland-Pfalz), Mainz, Deutschland
  • Gerhard Seebauer - Cancer Registry Rhineland-Palatinate (Krebsregister Rheinland-Pfalz), Mainz, Deutschland

HEC 2016: Health – Exploring Complexity. Joint Conference of GMDS, DGEpi, IEA-EEF, EFMI. München, 28.08.-02.09.2016. Düsseldorf: German Medical Science GMS Publishing House; 2016. DocAbstr. 440

doi: 10.3205/16gmds110, urn:nbn:de:0183-16gmds1103

Published: August 8, 2016

© 2016 Emrich et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License. See license information at http://creativecommons.org/licenses/by/4.0/.


Outline

Text

Epidemiologische Krebsregister gleichen neue Meldungen pseudonym mit der Datenbank ab [1]. Das bisherige Verfahren ordnet teilmanuell in 3-Monatszyklen Neumeldungen zum bestehenden Datenbestand des Krebsregisters zu. Hier gibt es verschiedene Systembrüche, da Teile der Bearbeitungsschritte zur Zuordnung in der Datenbank, in SAS und in MTB [2] erfolgen.

Rheinland-Pfalz wird aktuell zum klinisch-epidemiologischen Krebsregister reorganisiert. Zukünftig finden Personenzusammenführungen direkt nach Meldungseingang automatisiert im Identitätsdienst des Krebsregisters statt. Unklare Zuordnungen werden anhand von Klartextdaten geprüft. Der neue, systembruchfrei in die Datenbank integrierte pseudonyme Abgleich wird mit Zuordnungen der bisherigen Methode verglichen. Ziel ist die schnelle und möglichst fehlerfreie Personenzuordnung neuer Meldungen zu Personen der Datenbank.

Stochastische Gewichte des Record-Linkage werden mit zusätzlichen Filterregeln für „gute Zuordnungen“ kombiniert.

Die Entscheidungsregeln der Personenzuordnung werden durch eine Annahme- und Ablehnungsgrenze der stochastischen Gewichte des Record-Linkage definiert (Grenze1, Grenze2). Manuell zu prüfende Fälle liegen zwischen Grenze1 und Grenze2. Zusätzlich verwendet das Krebsregister Rheinland-Pfalz Filterregeln: Automatisierte Zuordnung erfolgt, wenn pseudonyme Namenskomponenten, pseudonyme Vornamenskomponenten (bzw. jeweils phonetische Kodes), Geschlecht, Geburtsmonat, Geburtsjahr und Gemeindekennziffer übereinstimmen.

Entscheidungsregeln:

  • Personen, welche im Rekord-Linkage keinen Fällen der Datenbank zugeordnet werden (Gewicht kleiner Grenze1 und Filterregeln nicht erfüllt), werden automatisiert übernommen,
  • Personen, werden automatisch Personen der Datenbank zugeordnet werden (Gewicht größer Grenze2 oder Filterkriterien sind erfüllt) und
  • Personen, welche im Identitätsdienst manuell zu überprüfen sind (Nachbearbeitung/ Clerical Review), und bei Bedarf im Klartext geprüft werden (Gewicht zwischen Grenze1 und Grenze2).

Der Goldstandardvergleich erfolgt anhand 40.000 teilmanueller Zuordnungen eines Bearbeitungszyklus von 2014. Entscheidungsgrenzen werden im Goldstandardvergleich empirisch derart variiert, dass möglichst geringe Homonym- und Synonymfehler [3] in Kauf genommen werden, unter Minimierung manuell zu prüfender Fälle.

Im bisherigen System wurden in 3 Monaten ca. 40.000 neuen Meldungen bearbeitet. Dabei wurden ca. 27.000 Personen teilmanuell bearbeitet und 1600 Personenzuordnungen aktiv manuell geprüft.

40.378 Neumeldungen aus November 2014 wurden mit dem neuen Ansatz erneut zugeordnet.

Ergebnis der Entscheidungsregeln (Grenze1=24, Grenze2=55, mit Goldstandardvergleich):

  • 12.223 Neumeldungen, Synonymfehler (Goldstandard) von 0,2% (28 Personen),.
  • 18.804 automatische Personenzuordnungen (Homonymfehler 0,01%, 2 Personen),
  • 1.898 Personenzuordnungen werden manuell geprüft. Die vorläufigen Personenzuordnungen werden lt. Goldstandardvergleich in 71,4% (1.356 Personen) bestätigt.

Empirischen Variierung der Gewichtsgrenzen: Im Goldstandardvergleich wird geschätzt, dass mit einer Fehlerrate von 0% in a) bei einer Grenze1=16 stattdessen 5.507 Personen geprüft werden müssten.

Die systembruchfreie Neuumsetzung des Record-Linkage in der Datenbank liefert im Testlauf sehr zufriedenstellende Ergebnisse. Das Verfahren wird in den nächsten Monaten optimiert in den Routinebetrieb des Krebsregisters integriert.

Obwohl perfekte Personenzuordnungen in klinisch-epidemiologischen Krebsregistern anzustreben sind, werden die genannten geringen Fehlerraten zunächst akzeptiert, da zu jeder erkrankten Person weitere Ereignisse gemeldet werden sollten, was Korrekturen ermöglicht.


Literatur

1.
Fellegi IP, Sunder AB. A theory of record linkage. JASA. 1969;64:1183-1210.
2.
Schnell R, Bachteler T, Bender S. A Toolbox for Record Linkage. Aus J Stat. 2004;33(1-2):125-133.
3.
Brennner H, Schmidtmann I, Stegmaier C. Effects of Record Linkage errors on registry based Follow-Up Studies. Stat Med. 1997;16:2633-2643.