gms | German Medical Science

MAINZ//2011: 56. GMDS-Jahrestagung und 6. DGEpi-Jahrestagung

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V.
Deutsche Gesellschaft für Epidemiologie e. V.

26. - 29.09.2011 in Mainz

Missklassifikation des Zielereignisses in Datenbankstudien

Meeting Abstract

Suche in Medline nach

  • Sigrid Behr - BIPS Universität Bremen, Bremen
  • Walter Schill - BIPS Universität Bremen, Bremen
  • Edeltraut Garbe - BIPS Universität Bremen, Bremen
  • Iris Pigeot - BIPS Universität Bremen, Bremen

Mainz//2011. 56. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds), 6. Jahrestagung der Deutschen Gesellschaft für Epidemiologie (DGEpi). Mainz, 26.-29.09.2011. Düsseldorf: German Medical Science GMS Publishing House; 2011. Doc11gmds070

DOI: 10.3205/11gmds070, URN: urn:nbn:de:0183-11gmds0704

Veröffentlicht: 20. September 2011

© 2011 Behr et al.
Dieser Artikel ist ein Open Access-Artikel und steht unter den Creative Commons Lizenzbedingungen (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.de). Er darf vervielfältigt, verbreitet und öffentlich zugänglich gemacht werden, vorausgesetzt dass Autor und Quelle genannt werden.


Gliederung

Text

Einleitung/Hintergrund: Es ist bekannt, dass fehlerbehaftete Studiendaten zu einer Verzerrung der Ergebnisse führen können. In vielen Studien wird jedoch davon ausgegangen, dass die Fehler den geschätzten Effekt abschwächen, was nur unter bestimmten Voraussetzungen richtig ist. In Datenbankstudien ist die Missklassifikation des Zielereignisses eine potentielle Fehlerquelle, die durch das Design der Studie beeinflussbar ist.

Material/Methoden: Um den Effekt von Missklassifikation des Zielereignisses in datenbankbasierten Studien zu untersuchen, wurden zwei Teilstudien auf Grundlage von Abrechnungsdaten einer gesetzlichen Krankenversicherung durchgeführt. Teilstudie 1 ist eine Kohortenstudie zu schweren Blutungen nach Phenprocoumonexposition, in der mit gegebenen Werten für Sensitivität und Spezifität in Abhängigkeit vom Expositionsstatus missklassifizierte Versionen des Zielereignisses simuliert wurden. Für jede Sensitivität und Spezifität wurde die Verteilung der Parameterschätzer aus einem Cox-Modell über jeweils 1.000 Kohortenanalysen ermittelt. Teilstudie 2 untersucht Risikofaktoren für akuten Myokardinfarkt in einem Fall-Kontroll Design. Das Zielereignis „Myokardinfarkt“ wurde auf drei Arten unter Benutzung verschiedener Diagnosetypen definiert. Die Definition mit der höchsten Spezifität beruhte allein auf Hauptentlassungsdiagnosen, während die Definition mit der niedrigsten Spezifität auch ambulante Diagnosen unabhängig von der Diagnosesicherheit berücksichtigte. Die Auswirkung der verschiedenen Definitionen auf die Risikoschätzer im bedingten logistischen Regressionsmodell wurde analysiert.

Ergebnis: Fehlende Sensitivität und fehlende Spezifität resultierten in Teilstudie 1 sowohl in einer Unterschätzung als auch in einer Überschätzung des Phenprocoumonrisikos. Dabei führten selbst hohe Werte für die Spezifität (>90%) zu großen Abweichungen der Schätzer für das Hazard Ratio bis hin zu einer Umkehrung des Phenprocoumoneffekts. Während bei fehlender Sensitivität größere Standardfehler beobachtet wurden, waren diese bei fehlender Spezifität reduziert.

Die Nutzung verschiedener Diagnosearten für die Identifikation von Myokardinfarkten in Teilstudie 2 wirkte sich ebenfalls teils abschwächend und teils verstärkend auf die Risikoschätzer in der logistischen Regression aus. Ein Beispiel hierfür ist der Effekt von Diabetes, dessen Odds Ratio von 1,5 (95% Konfidenzintervall (KI): 1,4–1,7) im Modell mit der höchsten Spezifität auf 1,2 (95% KI: 1,1–1,3) im Modell mit der niedrigsten Spezifität sank. Der Effekt der arteriellen Verschlusskrankheit (AVK) kehrte sich sogar um. Während die AVK bei hoher Spezifität ein signifikanter Risikofaktor für Myokardinfarkte ist, wurde bei niedriger Spezifität ein protektiver Effekt der AVK beobachtet.

Diskussion/Schlussfolgerung: Missklassifikation des Zielereignisses kann in Datenbankstudien zu großer Verzerrung führen, wobei der Einfluss mangelnder Spezifität besonders ausgeprägt ist. Daher sollten Studien im Hinblick auf eine hohe Spezifität des Zielereignisses konstruiert werden, indem z.B. nur stationäre Hauptentlassungsdiagnosen zur Identifikation des Zielereignisses benutzt werden. Bei einem hohen Potential für Missklassifikation können Sensitivitätsanalysen mit simulierten fehlerbehafteten Zielereignissen Aufschluss über das Ausmaß der Verzerrung geben.