gms | German Medical Science

53. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie

15. bis 18.09.2008, Stuttgart

Bootstrap-Methoden für multifaktorielle Dosis-Wirkungs-Beziehungen

Meeting Abstract

Suche in Medline nach

  • Peter Frommolt - Institut für Medizinische Statistik, Informatik und Epidemiologie der Universität zu Köln, Köln, Deutschland
  • Martin Hellmich - Institut für Medizinische Statistik, Informatik und Epidemiologie der Universität zu Köln, Köln, Deutschland

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie. 53. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds). Stuttgart, 15.-19.09.2008. Düsseldorf: German Medical Science GMS Publishing House; 2008. DocMBIO4-2

Die elektronische Version dieses Artikels ist vollständig und ist verfügbar unter: http://www.egms.de/de/meetings/gmds2008/08gmds065.shtml

Veröffentlicht: 10. September 2008

© 2008 Frommolt et al.
Dieser Artikel ist ein Open Access-Artikel und steht unter den Creative Commons Lizenzbedingungen (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.de). Er darf vervielf&aauml;ltigt, verbreitet und &oauml;ffentlich zug&aauml;nglich gemacht werden, vorausgesetzt dass Autor und Quelle genannt werden.


Gliederung

Text

Einleitung und Fragestellung

In Dosisfindungsstudien mit bifaktoriellem Design wird geprüft, ob Dosiskombinationen von Präparaten mit zwei (oder mehr) Wirkstoffen eine höhere Wirksamkeit aufweisen als beide Komponenten für sich betrachtet. Laska und Meisner (1989) [4]schlugen für diese Fragestellung den min-Test vor, dessen Teststatistik durch das Minimum von zwei Statistiken für den Test der jeweiligen Kombination gegen je eines der Einzelpräparate gebildet wird. Um die Frage zu beantworten, ob es mindestens eine Kombination mit der gewünschten Eigenschaft gibt, schlugen Hung, Chi und Lipicky (1993) [2] und Hung (2000) [3] den AVE- und MAX-Test vor, bei dem der Mittelwert bzw. das Maximum der beteiligten min-Statistiken gebildet wird. Die Frage, welche oder wie viele der betrachteten Kombinationsgruppen das o.g. Kriterium erfüllen, führt dann in die Problematik des multiplen Testens.

Man stellt fest, dass die Mächtigkeit der beschriebenen Methoden in hohem Maß davon abhängt, wie stark sich die Lageparameter zwischen den betrachteten Gruppen für die Einzelpräparate unterscheiden. Dies wird für jede Kombination (i, j) durch einen Störparameter δij beschrieben, der die entsprechende Differenz angibt. Für δ ij≈0 sind die o.g. Methoden sehr konservativ, während sie sich für |δij|>0 asymptotisch dem nominalen Signifikanzniveau nähern. Da die Störparameter der Grundgesamtheit in praktischen Anwendungen in der Regel unbekannt sind, wird untersucht, ob die in den Daten vorhandene Information über die δij verwendet werden kann, um eine gleichmäßig höhere Power zu erreichen.

Methoden

Bootstrap-Verfahren sind im Allgemeinen geeignet, um die Verteilung von Statistiken mit nicht trivialer Struktur zu simulieren; etwa auftretende Störparameter wie beim min-Test und beim AVE- und MAX-Test können dabei aus den Daten geschätzt werden. Ein weiterer Vorteil dieser Methoden ist die Möglichkeit, auf Annahmen über die Verteilung der Daten oder die Homogenität der Varianzen zu verzichten; zudem spielt es für den Algorithmus keine Rolle, ob die Stichproben in den Gruppen verschieden groß sind. Korrelationen der Teststatistiken fließen automatisch in die Berechnung ein, indem von zwei Statistiken gemeinsam verwendete Daten auch in der Simulation der Verteilung gemeinsam verwendet werden.

Bezogen auf bifaktorielle Studienpläne ist es im Gegensatz zu einem analytischen Ansatz ohne weiteres möglich, die Verfahren auf Designs mit binären Endpunkten oder auf Kombinationspräparate mit mehr als zwei Wirkstoffen auszudehnen. Mit ebenfalls einfacher Implementation können dazu simultane Konfidenzintervalle angegeben werden.

Ergebnisse

Simulationen der beschriebenen Algorithmen zeigen für einen einzelnen min-Test unter der entsprechenden Nullhypothese, dass für |δ11|>0 das nominale Niveau ((Sonderzeichen???)) deutlich überschritten wird, wenn die Randdifferenz aus den Daten geschätzt wird. Dies stimmt mit bereits von Snapinn (1987) [5] veröffentlichen Ergebnissen über den min-Test überein und hängt damit zusammen, dass die Lage der simulierten Verteilung der min-Statistik unter der Nullhypothese in asymmetrischer Weise von dem geschätzten Wert des Störparameters abhängt, der zumindest für kleine Stichproben mit großer Unsicherheit behaftet ist. Die Problematik liegt also in der Natur der min-Statistik und besteht daher auch noch, wenn die Prüfverteilung durch einen Bootstrap mit geschätzten Störparametern approximiert wird. Mit der konservativen Annahme |(δ11|=∞ aus dem Ansatz von Hung (2000) [3] wird für tatsächliche Werte δ≈0, wie dort beschrieben, das Niveau nicht mehr ausgeschöpft.

Für die Überdeckungswahrscheinlichkeit entsprechender Konfidenzintervalle kann bei unterschiedlichen Verteilungsbedingungen gezeigt werden, dass diese im Gegensatz auf der multivariaten t-Verteilung basierenden Verfahren immer mindestens 1-α=0.95 beträgt. Am Beispiel einer Bluthochdruckstudie [3] zeigt sich, dass klassische Methoden im Fall ungleicher Varianzen zu den gleichen Intervallen führen wie bei homoskedastischen Daten, während die Breite der Bootstrap-basierten Intervalle von der jeweiligen Stichprobenvarianz abhängt.


Literatur

1.
Hellmich M, Lehmacher W. Closure procedures for monotone bifactorial dose-response designs. Biometrics. 2005; 61: 269-276
2.
Hung HMJ, Chi GYH, Lipicky RJ. Testing for the existence of a desirable dose combination. Biometrics. 1993;49:85-94
3.
Hung HMJ. Evaluation of a combination drug with multiple doses in unbalanced factorial design clinical trials. Statistics in Medicine 2000; 19:2079-2087
4.
Laska EM, Meisner MJ. Testing whether an identified treatment is best. Biometrics 1989;45:1139-1151
5.
Snappin SM. Evaluating the efficacy of a combination therapy. Statistics in Medicine 1987;6:657-665