gms | German Medical Science

GMDS 2015: 60. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie

06.09. - 09.09.2015, Krefeld

Fallzahlrekalkulierung in adaptiven Enrichment-Designs basierend auf Störparametern

Meeting Abstract

Search Medline for

  • Marius Placzek - Universitätsmedizin Göttingen, Göttingen, Deutschland
  • Tim Friede - Universitätsmedizin Göttingen, Göttingen, Deutschland

GMDS 2015. 60. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS). Krefeld, 06.-09.09.2015. Düsseldorf: German Medical Science GMS Publishing House; 2015. DocAbstr. 144

doi: 10.3205/15gmds120, urn:nbn:de:0183-15gmds1203

Published: August 27, 2015

© 2015 Placzek et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License. See license information at http://creativecommons.org/licenses/by/4.0/.


Outline

Text

Einleitung: In jüngster Zeit steigt das Interesse an personalisierter Medizin und individualisierten Therapien. Dies hängt nicht zuletzt damit zusammen, dass es zunehmend Beispiele dafür gibt, dass eine vermeintlich homogene Gesamtpopulation bezüglich des Ansprechens einer Therapie oder eines Medikaments tatsächlich inhomogen ist. Derartige Subgruppen innerhalb einer Population können beispielsweise mittels Biomarker identifiziert werden. Wird nun eine herkömmliche klinische Studie durchgeführt, dann besteht die Gefahr, dass ein solcher, erhöhter oder alleiniger Effekt in der Subgruppe übersehen wird, da er womöglich in der gesamten Stichprobe untergeht (verwässert). Selbst wenn dennoch ein Effekt aufgedeckt wird, ist die Zulassung für die Gesamtpopulation ethisch bedenklich, da ein Großteil der Behandelten, die nicht zu der entsprechenden Subgruppe gehören, eine für sie unwirksame Therapie erhalten würden mit den eventuell damit verbundenen Nebenwirkungen. Daher ist es sinnvoll Studiendesigns zu betrachten, die einen Wirksamkeitsnachweis für die Gesamtpopulation und/oder eine Subgruppe zulassen, entsprechende Flexibilität besitzen und gleichzeitig den regulatorischen Anforderungen entsprechen. Dazu gehört zum Beispiel die Kontrolle Fehlerwahrscheinlichkeit des Fehlers erster Art über alle zu testenden Hypothesen (familywise error rate, FWER), da im beschriebenen Design multiple Hypothesen getestet werden. Zweistufige adaptive Designs erfüllen diese Anforderungen. Zwischen den beiden Stufen der Studie wird eine Interimsanalyse durchgeführt, bei der entsprechend der Zwischenergebnisse entschieden wird, in welcher Population der Wirksamkeitsnachweis im zweiten Teil der Studie durchgeführt werden soll – in der Gesamtpopulation und/oder der Subgruppe. Da in der Zwischenauswertung die Möglichkeit besteht das Testen lediglich in der Subpopulation fortzusetzen und dementsprechend nur noch aus dieser zu rekrutieren, nennt man solche Designs auch adaptive Enrichment-Designs. Wird im Vorfeld einer klinischen Studie die Stichprobenplanung durchgeführt, so setzt dies voraus, dass gewisse Annahmen über Störparameter, wie z.B. Varianzen in den einzelnen Populationen oder die Prävalenz der Subgruppe getroffen werden. Diese stammen häufig aus ähnlichen vorigen Studien oder einer Pilotstudie. Problematisch ist dabei, dass eine Missspezifikation dieser Störparameter dazu führt, dass eine zu hohe oder zu niedrige Fallzahl berechnet wird, sodass letztlich die geforderte Power überschritten oder unterschritten wird. Deshalb werden in diesem Beitrag Methoden untersucht, die ein solches adaptives Enrichment-Design robust gegen derartige Missspezifikationen in der Planung machen.

Material und Methoden: Zur Motivation der Prozeduren und Methoden zur Subgruppenanalyse wird eine von Frank et. al [1] veröffentlichte Depressionstudie präsentiert, die kürzlich erneut ausgewertet wurde mit dem Ziel, mögliche Subgruppen zu identifizieren [2]. Adaptive Methoden versprechen eine hohe Effizienz bei der Durchführung von Subgruppenanalysen. Hier werden zwei adaptive Teststrategien vorgestellt. Zum einen der sogenannte Kombinationstest [3], [4], bei dem beide Stufen des Designs separat behandelt werden und schließlich am Ende zur finalen Analyse kombiniert werden. Dabei werden die Daten aus der ersten Stufe verwendet, um p-Werte für die einzelnen Hypothesen der ersten Stufe zu berechnen. Nach der Interimsanalyse dienen allein die Daten aus Stufe 2 zur Berechnung der p-Werte der zweiten Stufe. Schließlich werden die p-Werte aus beiden Studienabschnitten mittels einer Kombinationsfunktion so kombiniert, dass der Fehler 1. Art kontrolliert wird. Zum anderen der Conditional Error Function Approach [5], bei dem basierend auf den Daten der ersten Stufe, eine bedingte Fehlerwahrscheinlichkeit berechnet wird. Am Ende der Studie wird dann mit den akkumulierten Daten (gewichtet nach den Stichprobenumfängen der beiden Stufen) zum Niveau des Conditional Errors getestet. Auch hier wird der Fehler 1. Art kontrolliert. Das Problem der Unsicherheiten in der Größe der Störparameter in der Planungsphase der Studie und das damit verbundene Risiko, eine zu hohe oder zu niedrige Fallzahl vorzugeben, wird in diesem Beitrag mit einer so genannten internen Pilotstudie [6], [7] adressiert. Dabei handelt es sich um einen Sample Size Review während der laufenden Studie. Das heißt, nach einem vorgegebenen Prozentsatz an Subjekten in der Studie, werden mit Hilfe der bis dahin erhaltenen Beobachtungen die Störparameter neu geschätzt und mit Hilfe dieser Schätzungen eine Fallzahlrekalkulierung durchgeführt. Dieser Sample Size Review kann unverblindet oder verblindet durchgeführt werden. Von vielen Regulationsbehörden wird die verblindete Variante bevorzugt [8]. Das Verhalten dieser Methoden wird bezüglich Charakteristiken wie dem Fehler 1. Art oder der Power sowie Stichprobenverteilung analysiert und in Simulationen demonstriert.

Ergebnisse: Wir werden zeigen, dass für normalverteilte Endpunkte die Kombination der adaptiven Enrichment-Designs mit einer internen Pilotstudie (Sample Size Review findet früh in der Studie vor der Interimsanalyse statt) zu einer flexiblen und gegen Missspezifikationen robusten Prozedur führt. Anhand von Simulationen zeigen wir, dass die kombinierte Methode die FWER kontrolliert, und inwiefern die gewünschte Power erreicht wird.

Diskussion: Es bleibt zu bemerken, dass die vorgestellte Prozedur noch nicht für nicht-normalverteilte Endpunkte, wie z.B. Zähldaten, erarbeitet ist. Dagegen wurden jedoch die obigen Überlegungen auch für Designs mit mehreren verschachtelten Subgruppen untersucht, wobei die Komplexität und somit die Laufzeit von Simulationen, beispielsweise in der Planungsphase einer Studie, deutlich steigt.

Diese Arbeit wurde im Rahmen des BMBF-Projektes (BundesMinisterium für Bildung und Forschung) "Biostatistische Methoden zur effizienten Evaluation von individualisierten Therapien (BIMIT)" (05M13MGE) gefördert.


Literatur

1.
Frank E, Cassano GB, Rucci P, Thompson WK, Kraemer HC, Fagiolini A, et al. Predictors and moderators of time to remission of major depression with interpersonal psychotherapy and SSRI pharmacotherapy. Psychological Medicine. 2011;41(1):151–162.
2.
Kraemer HC. Discovering, comparing, and combining moderators of treatment on outcome after randomized clinical trials: a parametric approach. Statistics in Medicine. 2013;32:1964-1973.
3.
Brannath W, Zuber E, Branson M, Bretz F, Gallo P, Posch M, Racine-Poon A. Confirmatory adaptive designs with Bayesian decision tools for a targeted therapy in oncology. Statistics in Medicine. 2009;28:1445-1463.
4.
Jenkins M, Stone A, Jennison C. An adaptive seamless phase II/III design for oncology trials with subpopulation selection using correlated survival endpoints. Pharmaceutical Statistics. 2011;10:347-356.
5.
Friede T, Parsons N, Stallard N. A conditional error function approach for subgroup selection in adaptive clinical trials. Statistics in Medicine. 2012;31:4309-4320.
6.
Wittes J, Brittain E. The role of internal pilot studies in increasing the efficiency of clinical trials. Statistics in Medicine. 1990;9:65–72.
7.
Friede T, Kieser M. Sample size recalculation in internal pilot study designs: A review (with discussion). Biometrical Journal. 2006;48:537-555.
8.
ICH E9 Expert Working Group. Statistical Principles for Clinical Trials: ICH Harmonized Tripartite Guideline. Statistics in Medicine. 1999;18:1905–1942.