gms | German Medical Science

49. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds)
19. Jahrestagung der Schweizerischen Gesellschaft für Medizinische Informatik (SGMI)
Jahrestagung 2004 des Arbeitskreises Medizinische Informatik (ÖAKMI)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie
Schweizerische Gesellschaft für Medizinische Informatik (SGMI)

26. bis 30.09.2004, Innsbruck/Tirol

Erweiterung der multiplen Testprozedur von Wiens auf eine datenabhängige Reihenfolge der Endpunkte

Meeting Abstract (gmds2004)

Suche in Medline nach

  • corresponding author presenting/speaker Siegfried Kropf - Otto-von-Guericke-Universität Magdeburg, Institut für Biometrie und Medizinische Informatik, Magdeburg, Deutschland
  • Ludwig A. Hothorn - Universität Hannover, Lehrgebiet Bioinformatik, Hannover, Deutschland

Kooperative Versorgung - Vernetzte Forschung - Ubiquitäre Information. 49. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds), 19. Jahrestagung der Schweizerischen Gesellschaft für Medizinische Informatik (SGMI) und Jahrestagung 2004 des Arbeitskreises Medizinische Informatik (ÖAKMI) der Österreichischen Computer Gesellschaft (OCG) und der Österreichischen Gesellschaft für Biomedizinische Technik (ÖGBMT). Innsbruck, 26.-30.09.2004. Düsseldorf, Köln: German Medical Science; 2004. Doc04gmds124

Die elektronische Version dieses Artikels ist vollständig und ist verfügbar unter: http://www.egms.de/de/meetings/gmds2004/04gmds124.shtml

Veröffentlicht: 14. September 2004

© 2004 Kropf et al.
Dieser Artikel ist ein Open Access-Artikel und steht unter den Creative Commons Lizenzbedingungen (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.de). Er darf vervielfältigt, verbreitet und öffentlich zugänglich gemacht werden, vorausgesetzt dass Autor und Quelle genannt werden.


Gliederung

Text

Einleitung

Kürzlich schlug Wiens [1] eine neue multiple Testprozedur für die parallele Betrachtung mehrerer Endpunkte in einer klinischen Studie vor. Sein Vorschlag kombiniert Eigenschaften der wohlbekannten Bonferroni-Holm-Prozedur [2] mit denen des Testens in a-priori gegebener Reihenfolge der Endpunkte bzw. Hypothesen [3]. Wie diese beiden Vorlagen hält auch Wiens' neuer Vorschlag den multiplen Fehler im strengen Sinne ein, also unabhängig davon, ob die globale Nullhypothese über alle Endpunkte erfüllt ist oder nicht.

Im vorliegenden Beitrag wird eine Erweiterung dieses Vorgehens dahingehend vorgenommen, dass die in der Prozedur ausgenutzte Reihenfolge der Endpunkte erst anhand der aktuellen Daten bestimmt wird. Dazu werden Techniken aus früheren Arbeiten von Kropf [4] bzw. Kropf und Läuter [5] auf den Vorschlag von Wiens übertragen. Weiterhin wird in gewisser Analogie zu Vorschlägen von Westfall et a. [6] versucht, auch die Gewichtung der Variablen datenabhängig vorzunehmen.

Vorschlag von Wiens

Wir betrachten die Prozedur von Wiens hier am Beispiel des Vergleichs zweier unabhängiger multivariat normalverteilter Stichproben mit gleicher Kovarianzmatrix:

Formel 1

und zunächst beliebigen Parametern

Formel 2

Getestet werden sollen die lokalen Hypothesen

Formel 3

zum multiplen Niveau α.

Nach dem Vorschlag von Wiens hat man die Endpunkte ohne Kenntnis der Daten in eine feste Reihenfolge zu bringen und zugehörige α-Werte α i ΄ festzulegen, so dass deren Summe das vorgegebene Niveau α nicht überschreitet. In der gegebenen Reihenfolge werden jetzt die üblichen Zwei-Stichproben-t-Tests zum Niveau α i durchgeführt, wobei α1 = α1΄ und α i = α i ΄, falls im Schritt vorher H i -1 nicht abgelehnt werden konnte bzw. α i = α i ΄ + α i -1, falls H i -1 abgelehnt wurde (i = 2, ..., p). Im Gegensatz zu einer gewichteten Bonferroni-Prozedur wird bei einem signifikanten Testergebnis der zugehörige α-Anteil also nicht aufgebraucht und steht im nachfolgenden Schritt zusätzlich zur Verfügung. Die Reihenfolge wird dabei ausgenutzt, jedoch nicht so stark wie beim Testen mit a-priori geordneten Hypothesen, wo zwar auf eine α-Adjustierung verzichtet werden kann, aber beim ersten nicht signifikanten Ergebnis die Prozedur abgebrochen werden muss.

Erweiterungen der Prozedur

Falls in einer Testprozedur keine sinnvolle a-priori Ordnung gegeben ist, kann man folgende zwei Erweiterungen der Prozedur von Wiens nutzen, die beide auf den Quadratsummenwerten

Formel 4

beruhen [Abb. 1]. Die nachfolgenden Vorschläge basieren auf der Annahme, dass die Varianzen der p Variablen annähernd gleich groß sind. Andernfalls wird der Fehler erster Art im unten beschriebenen Sinne trotzdem eingehalten, jedoch verlieren die Prozeduren dann an Güte. Bei etwa gleichgroßen Varianzen sind größere Werte der Quadratsummen tendenziell ein Zeichen für große absolute Mittelwerte, also für stärkere Abweichungen von der Nullhypothese.

Modifikation 1:

Die bei Wiens a-priori vorzugebende Reihenfolge der Endpunkte wird anhand der w i festgelegt, indem die Variablen nach fallenden Werten dieser Quadratsummen geordnet werden. Der weitere Ablauf der Prozedur bleibt erhalten. Dabei entspricht jetzt α1 dem ersten Endpunkt nach Sortierung, α1 dem zweiten, usw.

Da jetzt keine feste Zuordnung der Hypothesen zu den vorab festzulegenden α-Anteilen besteht, verlieren die im Beispiel von Wiens verwendeten sachlichen Argumente zur α-Aufteilung an Bedeutung. Sie werden durch formalere Überlegungen ersetzt. Eine zurückhaltende Variante besteht in der gleichen Aufteilung von α auf alle Variablen. Der Nutzen durch die Sortierung besteht dann lediglich darin, die Endpunkte mit einer höheren Chance auf Ablehnung der zugehörigen Hypothesen auf die vorderen Plätze zu sortieren und die bei einer Ablehnung aufgesparten α-Anteile für die folgenden Variablen zu nutzen.

Eine andere Möglichkeit besteht in der Wahl α i = α·λ i · (1-λ). Der Parameter λ kann dabei zwischen 0 und 1 gewählt werden. λ-Werte nahe 0 legen größeres Gewicht auf die ersten Variablen und "vertrauen" dabei stärker auf die Information aus den Quadratsummen, Werte nahe 1 neigen stärker zu einer gleichmäßigen Gewichtung der Variablen, gehen damit aber auch nicht so stark das Risiko einer durch Heterogenität der Varianzen fehlgeleiteten Reihenfolge der Variablen ein.

Modifikation 2:

Hier wird die Definition der α i nicht nur von der Ordnung der w i abhängig gemacht, sondern auch von deren absoluten Größe:

Formel 5

Wieder sprechen große Werte des frei (aber vorab) zu wählenden Parameters η für eine stärkere Gewichtung der Variablen in den vorderen Positionen, kleine dagegen für eine gleichmäßigere Gewichtung.

Bei Modifikation 1 lässt sich zeigen, dass das multiple Fehlerniveau im strengen Sinne eingehalten wird, bei Modifikation 2 ist bislang nur der Beweis für die Einhaltung des multiplen Niveaus unter der globalen Nullhypothese gelungen. In Simulationsuntersuchungen wurde jedoch auch für Modifikation 2 bislang keine Überschreitung des multiplen Fehlers in strengen Sinne festgestellt.

Im Vortrag werden die verschiedenen Verfahren einander und anderen Prozeduren gegenübergestellt, an Beispielen sowie in Simulationsuntersuchungen.

Schlussbemerkungen

Die Verfahren lassen sich ganz analog auf den Einstichprobenfall (Test auf den Erwartungswert 0) mit den entsprechend modifizierten Quadratsummen

Formel 6

übertragen. Dabei kommen dann Einstichproben-t-Tests zur Anwendung. Ebenso sind verteilungsunabhängige Varianten in Analogie zu [7] angebbar. Hierbei werden anstelle der Quadratsummen Ordnungsstatistiken verwendet. Die t-Tests werden durch entsprechende Rangtests ersetzt.


Literatur

1.
Wiens BL. A Fixed Sequence Bonferroni Procedure for Testing Multiple Endpoints. Pharmaceutical Statistics 2003; 2: 211-5.
2.
Holm S. A Simple Sequentially Rejective Multiple Test Procedure. Scand. J. Statist.1979; 6: 65-70
3.
Bauer P, Röhmel J, Maurer W, Hothorn LA. Testing Strategies in Multiple-Dose Experiments Including Active Control. Statistics in Medicine 1998; 17: 2133-46.
4.
Kropf, S. Hochdimensionale multivariate Verfahren in der medizinischen Statistik. Aachen: Shaker; 2000.
5.
Kropf S, Läuter J. Multiple Tests for Different Sets of Variables Using a Data-Driven Ordering of Hypotheses, with an Application to Gene Expression Data. Biometrical Journal 2002; 44: 789-800
6.
Westfall PH, Kropf S, Finos L. Weighted FWE-Controlling Methods in High-Dimensional Situations. In: Benjamini Y, Bretz F, Sarkar SK, Hrsg. Recent Dvelopments in Multiple Comparison Procedures. IML Lecture Notes and Monograph series. Accepted for publication.
7.
Kropf S, Läuter J, Eszlinger M, Krohn K, Paschke R. Nonparametric Multiple Test Procedures with Data-driven Order of Hypotheses and with Weighted Hypotheses. Journal of Statistical Planning and Inference 2004; in press.