gms | German Medical Science

50. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds)
12. Jahrestagung der Deutschen Arbeitsgemeinschaft für Epidemiologie (dae)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie
Deutsche Arbeitsgemeinschaft für Epidemiologie

12. bis 15.09.2005, Freiburg im Breisgau

Verlängerung von Studien mit t-verteilten Teststatistiken

Meeting Abstract

  • Nina Timmesfeld - Philipps-Universität Marburg, Marburg
  • Helmut Schäfer - Philipps-Universität Marburg, Marburg
  • Hans-Helge Müller - Philipps-Universität Marburg, Marburg

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie. Deutsche Arbeitsgemeinschaft für Epidemiologie. 50. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds), 12. Jahrestagung der Deutschen Arbeitsgemeinschaft für Epidemiologie. Freiburg im Breisgau, 12.-15.09.2005. Düsseldorf, Köln: German Medical Science; 2005. Doc05gmds048

The electronic version of this article is the complete one and can be found online at: http://www.egms.de/en/meetings/gmds2005/05gmds260.shtml

Published: September 8, 2005

© 2005 Timmesfeld et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution License (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en). You are free: to Share – to copy, distribute and transmit the work, provided the original author and source are credited.


Outline

Text

Hintergrund

Im Falle normalverteilter Beobachtungen mit unbekannter Varianz und kleiner Fallzahlen führt die Verwendung der Normalverteilungsapproximation für die t-Statistik zu einer Überschreitung des Fehlerniveaus 1. Art. In diesen Fällen sollte ein exakter Test verwendet werden, z.B. für eine Studie ohne Zwischenauswertungen der t-Test. Allerdings ist es zu Studienbeginn oft schwierig eine geeignete Fallzahl zu bestimmen, da diese von der unbekannten Varianz abhängt und die Schätzer aus vorherigen Studien oft unzureichend sind. Aus diesem Grund möchte man im Verlaufe der Studie die Möglichkeit haben, den Varianzschätzer der bisherigen Beobachtungen zur Neubestimmung der Fallzahl zu verwenden, insbesondere falls die Studie unterpowert ist. Eine “naive“ Vorgehensweise führt auch hier wieder zu einer Erhöhung der Fehlerwahrscheinlichkeit 1. Art.

In den letzten Jahren wurden verschiedene Methoden vorgestellt, die zur Fallzahländerung an festgelegten Zwischenauswertungen unter Einhaltung des Fehlerniveaus 1. Art verwendet werden können. So können adaptive Designs [1], [2], die auf der Kombination von p-Werten beruhen, insbesondere für Fallzahländerungen verwendet werden. Weiterhin gibt es Studiendesigns mit interner Pilot Studie, nach deren Ende eine Neuberechnung der Fallzahl mit fest vorgegebener Regel möglich ist [3].

Methoden und Ergebnisse

Möchte man eine Änderung nach einer ungeplanten Zwischenauswertung vornehmen, so kann dies z.B. im Falle des z-Tests mit Hilfe des Conditional Rejection Probability (CRP) -Prinzips [4] geschehen. Eine direkte Anwendung dieser Methode im Falle des t-Test ist aufgrund der Abhängigkeit der CRP von der unbekannten Varianz [5] nicht möglich.

Wir werden eine Erweiterung des Prinzips für Fallzahlverlängerungen beim t-Test vorstellen. Es wird gezeigt werden, dass viele Eigenschaften des CRP-Prinzips auch für die Erweiterung gelten. So ist die Einhaltung des Fehlerniveaus 1. Art unabhängig von der verwendeten Regel gesichert ist. Ebenso kann mit dem optimalen Test, dem t-Test, begonnen und dieser solange verwendet werden, wie die Fallzahl nicht geändert wird. Dies bedeutet insbesondere, dass im Falle keiner Änderungen das optimale Designs verwendet wird. Eine weitere Eigenschaft unseres Verfahrens besteht darin, dass jede noch so kleine Verlängerung die Power verbessert.

Diskussion

Im Vergleich zu den bisherigen Methoden ermöglicht unser Vorschlag eine flexiblere Fallzahländerung dadurch, dass weder der Zeitpunkt noch die Regel zur Änderung am Studienbeginn festgelegt werden muß.

Weiterhin “bestrafen“ die bisherigen Verfahren die Möglichkeit zur Fallzahländerung durch eine Verringerung der Power im Vergleich zum t-Test. Selbst bei einer geringen Fallzahlerhöhung an der Zwischenauswertung kann dies bedeuten, dass die Gesamtpower immer noch niedriger ist als die Power des t-Test mit der ursprünglichen Fallzahl. Bei unserem Verfahren hingegen wird gute Planung nicht “bestraft“, da die Power immer mindestens so groß ist, wie die Power des t-Test mit der ursprünglichen Fallzahl.

Danksagung

Diese Arbeit wurde unterstützt durch die Deutschen Forschungsgemeinschaft, GZ SCHA 542/9.


Literatur

1.
Bauer P, Köhne K. Evaluation of experiments with adaptive interim analyses. Biometrics 1994; 50(4): 1029-1041
2.
Lehmacher W, Wassmer G. Adaptive sample size calculations in group sequential trials. Biometrics 1999; 55(4): 1286-1290
3.
Kieser M, Friede T. Re-calculating the sample size in internal pilot study designs with controlof the type I error rate. Statistics in Medicine 2000; 19(7): 901-911
4.
Müller HH, Schäfer H. A general statistical principle for changing a design any time during the course of a trial. Statistics in Medicine 2004; 23(16): 2497-2508
5.
Posch M, Timmesfeld N, König F, Müller HH. Conditional rejection probabilities of student's t-test and design adaptations Biometrical Journal 2004;46 (4): 389-403