Article
Ein nichtparametrischer Ansatz zur ROC-Analyse bei mehrfacher Datenerhebung an jeder Beobachtungseinheit
Search Medline for
Authors
Published: | September 2, 2009 |
---|
Outline
Text
Einleitung: In einer ROC-Analyse, in der ein stetiger Prädiktor hinsichtlich seiner diagnostischen Fähigkeit bewertet wird, berechnet man üblicherweise die Fläche unter der ROC-Kurve (AUC) aus der Richtigpositiv- und Falschpositiv-Rate des Prädiktors bei unterschiedlichen Cutoff-Werten. Die Berechnung des Standardfehlers der AUC wird erschwert, wenn die genutzten Daten nicht aus je einer Messung, sondern aus Mehrfachmessungen an jeder Beobachtungseinheit bestehen. In der Literatur werden verschiedene Lösungsansätze des Problems vorgeschlagen. Keiner dieser Ansätze kann jedoch aufgrund z.T. nicht unerheblicher Schwächen als anerkanntes Standardverfahren angesehen werden. So setzt der Ansatz von Gönen und Heller [1] eine spezielle Form der ROC-Kurve voraus, die den empirischen Gegebenheiten in der Praxis nicht immer entspricht. Pepe et al. [2] schlagen einen nichtparametrischen Ansatz vor und gewinnen den Standardfehler der AUC mit Hilfe von Bootstrap-Verfahren. Einem solchen Ansatz ist eine Lösung vorzuziehen, in der der Standardfehler direkt berechnet wird.
Material und Methoden: In der vorliegenden Arbeit wird ein neu entwickeltes Verfahren zur approximativen Berechnung der AUC unter der ROC-Kurve vorgestellt, das als nichtparametrischer Ansatz keine spezielle Form der ROC-Kurve unterstellt [3]. Die gesuchte Fläche wird zunächst mit Hilfe trigonometrischer Argumente auf die Differenz zwischen der Richtigpositiv- und Falschpositiv-Rate des Prädiktors bei unterschiedlichen Cutoff-Werten zurückgeführt. Anschließend werden diese Differenzen als Funktion des Mittelwertes des Prädiktors ausgedrückt. Das Verfahren entwickelt seine volle Leistungsfähigkeit, wenn man in einem ersten Schritt von den Originalwerten des Prädiktors zu deren Rängen übergeht. Es funktioniert im Falle unabhängiger Stichprobendaten und lässt sich relativ leicht auf den Fall vorliegender Mehrfachmessungen an jeder Beobachtungseinheit erweitern.
Ergebnisse: Zunächst wird die Güte des neuartigen Verfahrens anhand simulierter Daten untersucht und belegt. Darüber hinaus erfolgt eine Anwendung auf Echtdaten einer radiologischen Studie. Bei jedem Studienpatienten wurden mehrere Lymphknoten hinsichtlich der Existenz eines Lymphoms bewertet, indem der wirkliche Befall anhand einer PET-Untersuchung ermittelt und als stetiger Prädiktor das RECIST-Kriterium angewandt wurde, d.h. der Durchmesser in längster Ausdehnung.
Literatur
- 1.
- Gönen M, Heller G. Lehmann Family of ROC Curves. Under review.
2007. Available at http://works.bepress.com/mithat_gonen/13
- 2.
- Pepe M, Longton GM, Janes H. Estimation and Comparison of Receiver Operating Characteristic Curves. UW Biostatistics Working Paper Series 2008; Working Paper 323. 2008. Available at http://www.bepress.com/uwbiostat/paper323
- 3.
- Gerß J. A Nonparametric Approach to ROC Analysis for Clustered Data. Submitted to Statistics in Medicine.