gms | German Medical Science

GMDS 2015: 60. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie

06.09. - 09.09.2015, Krefeld

Methoden für exakte Kontrolle des Signifikanzniveaus bei Changepoint-Verfahren für binäre Endpunkte mit Anwendung in klinischen Registern und Diagnosestudien

Meeting Abstract

Suche in Medline nach

  • David Ellenberger - Universitätsmedizin Göttingen, Göttingen, Deutschland
  • Tim Friede - Universitätsmedizin Göttingen, Göttingen, Deutschland

GMDS 2015. 60. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS). Krefeld, 06.-09.09.2015. Düsseldorf: German Medical Science GMS Publishing House; 2015. DocAbstr. 172

doi: 10.3205/15gmds145, urn:nbn:de:0183-15gmds1451

Veröffentlicht: 27. August 2015

© 2015 Ellenberger et al.
Dieser Artikel ist ein Open-Access-Artikel und steht unter den Lizenzbedingungen der Creative Commons Attribution 4.0 License (Namensnennung). Lizenz-Angaben siehe http://creativecommons.org/licenses/by/4.0/.


Gliederung

Text

Einleitung: Changepoint-Verfahren werden in den verschiedensten Anwendungsgebieten eingesetzt. So benötigen Auswertungen von klinischen Datenbanken wie Registerdaten eine adäquate multivariate Adjustierung relevanter Kovariablen, insbesondere von Kalenderzeiteffekten. Neben Modellen, welche eine möglichst glatte Anpassung der Daten vornehmen (z.B. Restricted Cubic Spline Regression) werden häufig Modelle benötigt, welche eine Separierung der Daten anstreben. Dies ist insbesondere der Fall, wenn über die Art des (kausalen) Zusammenhangs wenig bekannt ist oder wenn abrupte Übergänge zu erwarten sind. Vermehrte Anwendung finden hier sogenannte Changepoint Verfahren, welche weitreichende Möglichkeiten einer adäquaten Modellierung von ordinalen (bzw. metrischen) erklärenden Variablen bieten (siehe z.B. Friede und Henderson 2003 [1]). In der neueren Forschung ist insbesondere die Analyse von Wechselwirkungen von Interesse (siehe z.B. Dimick und Ryan 2014 [2]). Für binäre Endpunkte gibt es zahlreiche Verfahren in unterschiedlichen Szenarien. So ist eine Erweiterung für Kovariablen möglich (siehe z.B. Friede et al 2006 [3]), als auch darüberhinausgehend den Einschluss von Wechselwirkungstermen (siehe z.B. Fong et al. 2015 [4]). Während letztgenannte Verfahren auf Approximationen beruhen ist es in Szenarien ohne zusätzlichen Kovariablen möglich exakte Verfahren anzugeben (siehe z.B. Worsley 1983 [5]). Hierbei tritt jedoch eine allgemeine Problematik des statistischen Testens von kategoriellen Daten auf, dass das vorgegebene Signifikanzniveau (z.B. 5%) aufgrund der diskreten Verteilung nicht voll ausgeschöpft werden kann. Lösungsansätze mittels einer Randomisierung des Tests, sind unter anderem wegen mangelnder Reproduzierbarkeit nicht empfehlenswert.

Material und Methoden: Für eine optimale Ausschöpfung des Signifikanzniveaus bietet es sich stattdessen an, die Informationen der erklärenden Variable abseits eines potentiellen Changepoints zu nutzen. Ein Changepoint ergibt sich als eindeutiges Maximum einer Teststatistik über die Sequenz aller möglichen Punkte der erklärenden Variable (z.B. Zeit). Übliche Teststatistiken mit bekannten exakten Verteilungen nach Worsley [5] sind die Likelihoodratio (LR) Teststatistik oder die Cumulative Sums (CUSUM)Teststatistik. Bedingt auf solch ein Maximum an einem gewissen (Zeit-)Punkt werden Ordnungen vorgestellt, welche auf den Abschnitten vor und nach dem Changepoint beruhen. Es wird gezeigt, dass sich Ordnungen auf Basis von Post-hoc-Tests auf den Sequenzen vor und nach dem Changepoint in Analogie zur binären Segmentierung definieren lassen. Mit der Berechnung der bedingten Verteilung lässt sich nun eine geeignete Testprozedur festlegen, welche eine verbesserte Ausschöpfung des Signifikanzniveaus auch für kleine Stichprobenumfänge erlaubt.

Als weiterer Ansatz zur Ausschöpfung des Signifikanzniveaus bieten sich unkonditionale Testverfahren, analog zu Barnards Test in Vierfeldertafeln, an (siehe z.B. Mehrotra et al. 2003 [6]). Adaptionen auf ein Changepoint-Modell werden vorgestellt und mit dem entwickelten obigen Verfahren in Simulationen verglichen.

Ergebnisse: Die Simulationen bestätigen, dass sich das Signifikanzniveau für kleine Stichprobenumfänge oder aber bei einer geringen Anzahl von Events besser ausschöpfen lässt. Dies impliziert eine erhöhte statistische Power. Es wird darüber hinaus eine Anwendung der Changepoint-Methoden auf Diagnostische Kriterien vorgestellt. So kann man das vorgestellte Changepoint Testverfahren für den Youdenindex nutzen, wenn man keine parametrischen Annahmen an die Verteilungen des verwendeten Biomarkers stellen möchte.

Diskussion: Mit der Verbesserten Ausschöpfung des Signifikanzniveaus kann ein Gewinn der Power erzielt werden, welcher die Ergebnisse von Worsley [5] verbessert und durch die Rechenkapazitäten moderner Computer auch bei großen Stichprobenumfängen keinerlei Nachteile besitzt. Die Anwendungsmethoden in Fragestellungen der Modellierung als auch der Dichotomisierung von Variablen sind vielfältig. Weiterentwicklungen des Verfahrens auf Segmentierungen mit mehreren Changepoints werden diskutiert.


Literatur

1.
Friede T, Henderson R. Intervention effects in observational survival studies with an application in total hip replacements. Statistics in Medicine. 2003;22:3725-3737.
2.
Dimick JB, Ryan AM. Methods for Evaluating Changes in Health Care Policy: The Difference-in-Differences Approach. JAMA. 2014 Dec 10;312(22):2401.
3.
Friede T, Henderson R, Kao C-F. A note on testing for intervention effects on binary responses. Methods Inf Med. 2006;45(4):435–40.
4.
Fong Y, Di C, Permar S. Change point testing in logistic regression models with interaction term. Statistics in Medicine. 2015; [Epub ahead of print]
5.
Worsley KJ. The power of likelihood ratio and cumulative sum tests for a change in a binomial probability. Biometrika. 1983;70:455-64.
6.
Mehrotra DV, Chan ISF, Berger RL. A Cautionary Note on Exact Unconditional Inference for a Difference between Two Independent Binomial Proportions. Biometrics. 2003 Jun;59(2):441–50.