gms | German Medical Science

53. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie

15. bis 18.09.2008, Stuttgart

Der Homogenitätstest zum Vergleich zweier Erfolgsraten – ein Bayes-Ansatz im Vergleich zum klassischen Chiquadrat-Test

Meeting Abstract

Suche in Medline nach

  • Joachim Gerß - Universität Münster, Münster, Deutschland

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie. 53. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds). Stuttgart, 15.-19.09.2008. Düsseldorf: German Medical Science GMS Publishing House; 2008. DocMBIO5-5

Die elektronische Version dieses Artikels ist vollständig und ist verfügbar unter: http://www.egms.de/de/meetings/gmds2008/08gmds073.shtml

Veröffentlicht: 10. September 2008

© 2008 Gerß.
Dieser Artikel ist ein Open Access-Artikel und steht unter den Creative Commons Lizenzbedingungen (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.de). Er darf vervielf&aauml;ltigt, verbreitet und &oauml;ffentlich zug&aauml;nglich gemacht werden, vorausgesetzt dass Autor und Quelle genannt werden.


Gliederung

Text

Einleitung und Fragestellung

Klassische Signifikanztests sind ein etabliertes Standardverfahren der konfirmativen Statistik. In explorativen Fragestellungen dagegen erweisen sie sich als weniger geeignet. Dies ergibt sich insbesondere aus dem konservativen Grundsatz, d.h. der primären Kontrolle des Fehlers 1. Art anstelle des Fehlers 2. Art. Darüber hinaus erlaubt das grundlegende Paradigma der frequentistischen Statistik keine Angabe prädiktiver Werte für die Gültigkeit einer der beiden Hypothesen des Testproblems. Da derartige Angaben andererseits in vielen Anwendungen von großem Interesse sind, wird das Testergebnis häufig dementsprechend fehlinterpretiert. Die genannten Probleme lassen sich lösen, indem anstatt des klassischen Ansatzes zur Lösung eines Testproblems auf Bayes-Verfahren zurückgegriffen wird[1] , [2], [3], [4]. Der Bayes-Ansatz ermöglicht eine Abwägung zwischen zwei Hypothesen, die gleichwertig gegenübergestellt werden, und liefert direkt interpretierbare Angaben in Form prädiktiver Werte.

Als Beispiel einer explorativen Fragestellung denke man an die Auswertung der Sicherheit und Verträglichkeit des Prüfpräparats in einer klinischen Studie. Klassisch würde man in diesem Fall die Nullhypothese der Unbedenklichkeit gegen eine gegensätzliche Alternativhypothese testen – ggf. zu einem relativ schwachen Signifikanzniveau von beispielsweise 10%, um auf diese Weise eine größere Power zu erzielen. Dennoch bleibt der Signifikanztest konservativ und entscheidet „im Zweifel“ zugunsten der Unbedenklichkeit, was offenbar nicht den Anforderungen einer geeigneten Sicherheitsanalyse entspricht. Der alternative Bayes-Ansatz dagegen kann weitaus besser auf die sensible Entdeckung von Sicherheitsproblemem ausgerichtet werden. Darüber hinaus erlaubt der Ansatz die unmittelbare Beantwortung von Fragen der Art: „Mit welcher Wahrscheinlichkeit ist das Prüfpräparat als bedenklich anzusehen?“; „Um wie viel wahrscheinlicher ist die Hypothese der Bedenklichkeit des Prüfpräparates als dessen Unbedenklichkeit?“; „Wie groß ist die Beweislast für ein relevantes Sicherheitsproblem, etwa definiert als Erhöhung der Nebenwirkungsrate durch das Prüfpräparat um mehr als einen Faktor 2?“

Material und Methoden

Als grundlegende Problemsituation wird der Vergleich zweier Erfolgsraten behandelt, die in unabhängigen Stichproben beobachtet werden. Der χ2-Homogenitätstest stellt in dem Fall die klassische Lösung des Testproblems der Gleichheit beider Erfolgswahrscheinlichkeiten gegenüber der gegensätzlichen Alternative dar.

Im Rahmen eines Bayes-Ansatzes formuliert man ein zweistufiges so genanntes Beta-Binomial-Modell [5]. In der ersten Modellstufe werden die (unbedingten) „A-priori“-Verteilungen der Erfolgswahrscheinlichkeiten in Form zweier unabhängiger Beta-Verteilungen modelliert. Mögliches Vorwissen kann dabei anhand einer geeigneten Wahl so genannter Hyperparameter eingebracht werden. Andererseits kann auf die Einbeziehung von explizitem Vorwissen verzichtet werde, indem nicht-informative A-priori-Verteilungen gewählt werden. Auf der zweiten Stufe der Modellgleichung formuliert man die bedingte Binomialverteilung der beobachteten Anzahl Erfolge in jeder Stichprobe bei gegebener jeweiliger Erfolgswahrscheinlichkeit. Die empirische Auswertung des Modells liefert als „A-posteriori“-Verteilungen der gesuchten Erfolgswahrscheinlichkeiten ebenfalls Beta-Verteilungen. Dabei werden die Verteilungsparameter der A-priori-Verteilungen angepasst, um die zusätzliche Information der erhobenen Daten zu berücksichtigen. Nachdem zunächst beide (unabhängigen) Erfolgswahrscheinlichkeiten separat voneinander modelliert werden, wird in einem nächsten Schritt die gemeinsame A-posteriori-Verteilung der entsprechenden Zufallsvariablen und anhanddessen anschließend die Verteilung deren Differenz bestimmt. Mit der Kenntnis dieser Verteilung eröffnen sich weitreichende Möglichkeiten der weiteren Auswertung, die die unmittelbare Beantwortung der obigen konkreten Fragen durch geeignete Integration ermöglichen. Der Ansatz so genannter Bayes-Faktoren stellt eine direkte Bayesianische Übertragung der Idee des klassischen Signifikanztests dar. Dabei wird auf der Basis eines zugrundeliegenden Testproblems zunächst jeder der beiden Hypothesen eine A-priori-Wahrscheinlichkeit zugeordnet. Anschließend wird das Verhältnis der A-posteriori-Wahrscheinlichkeiten beider Hypothesen in Form des „Bayes-Faktors“ bestimmt. Ein Bayes-Faktor von 1 zeigt an, dass beide Hypothesen gleichermaßen unterstützt werden. Je weiter der Bayes-Faktor andererseits vom Wert 1 abweicht, desto stärkere Evidenz zugunsten einer der beiden Hypothesen liegt vor.

Ergebnisse

Neben der theoretischen Darstellung des Bayes-Ansatzes zum Vergleich zweier Erfolgswahrscheinlichkeiten wird ein R-Paket vorgestellt, mit dem der Ansatz empirisch umgesetzt werden kann. Die Anwendung des R-Pakets wird anhand von Beispieldaten klinischer Studien vorgeführt.

Abschließend wird eine vergleichende Gegenüberstellung des „Bayesianischen Homogenitätstests“ zum klassischen χ2-Homogenitätstest vorgenommen. Dazu werden auf der Grundlage umfangreicher Simulationen in unterschiedlichen Szenarien die Unterschiede beider Ansätze herausgearbeitet.


Literatur

1.
Goodman SN. Introduction to Bayesian methods I: measuring the strength of evidence. Clinical Trials 2005; 2: 282-290.
2.
Louis TA. Introduction to Bayesian methods II: fundamental concepts. Clinical Trials 2005; 2: 291-294.
3.
Berry DA. Introduction to Bayesian methods III: use and interpretation of Bayesian tools in design and analysis. Clinical Trials 2005; 2: 295-300.
4.
Spiegelhalter DJ, Abrams KR, Myles JP. Bayesian Approaches to Clinical Trials and Health-Care Evaluation. New York: Wiley; 2004.
5.
Gelman A, Carlin JB, Stern HS, Rubin DB. Bayesian Data Analysis. Boca Raton: Chapman&Hall/CRC; 1995.