Artikel
Multiples Testen mit datengewichteten P-Werten bei binären Daten
Suche in Medline nach
Autoren
Veröffentlicht: | 8. September 2005 |
---|
Gliederung
Text
Für normalverteilte Daten schlugen Westfall et al. [Ref. 1] eine multiple Prozedur mit datenabhängig gewichteten P-Werten vor, die das multiple Niveau α (engl. familywise type I error α in the strong sense) einhält unter jeder Kombination von wahren und falschen Hypothesen. In [Ref. 2] wurde eine multiple Prozedur mit einem multivariaten Test für Genexpressionsanalysen entwickelt. Auch für nicht-normalverteilte Daten wurde von Kropf et al. [Ref. 3] eine entsprechende multiple Prozedur vorgeschlagen. Im Vortrag wird eine solche Prozedur für binäre Daten vorgestellt.
Gegeben seien zwei Populationen (z.B. Patienten mit einer speziellen Erkrankung und Kontrollen) von denen Stichproben von p binären Merkmalen vorliegen. Dabei wird von der Modellannahme ausgegangen, dass sich die beiden multivariaten Bernoulli Verteilungen nur durch Verschiebeparameter μ i unterscheiden:
und
mit
Diese Modellannahme besitzt eine gewisse Analogie zur Annahme gleicher Kovarianzmatrizen bei multivariaten Mittelwertvergleichen und scheint mir deshalb durchaus plausibel. Von Interesse sind nun die lokalen Nullhypothesen H
i
, dass die eindimensionalen Randverteilungen gleich sind, die entsprechen. Aus obiger Modellannahme folgt, dass die multivariate Verteilung aller Merkmale zu wahren lokalen Nullhypothesen in beiden Populationen gleich ist.
Gegeben seien n
(1)
Fälle aus der ersten Population und n
(2)
Fälle aus der zweiten Population: . Werden die „Ereignisse“ mit 1 kodiert, ergeben sich die folgenden mittleren Ereignisraten
für
, die in der folgenden Prozedur mit datenabhängig gewichteten P-Werten verwendet werden:
1. Berechne die P-Werte der exakten Fisher-Tests,
2. die Gewichte und gewichtete P-Werte
3. Ordne die Variablen danach
4. Lehne die so geordneten Hypothesen H
(j)
solange ab wie
Stoppe bei der ersten nichtsignifikanten Variablen.
Beh.: Diese Prozedur hält für obiges Modell das multiple Niveau α ein.
Um den Beweis zu skizzieren, betrachten wir vorerst nur Variablen mit Indizes aus der Menge M
0
aller Indizes zu wahren lokalen Nullhypothesen. Alle Teildatenvektoren mit Indizes aus M
0
sind aus derselben |M
0
|-dimensionalen Verteilung (s.o.), deshalb sind alle Permutationen der Gruppenzugehörigkeit gleich wahrscheinlich. In der Klasse aller dieser Permutationen sind unverändert. Deshalb zeigt eine kurze Rechnung, dass Q
(1)
das Niveau α einhält. Weil das für jede solche Klasse gilt, auf die man bedingen kann, gilt es auch unbedingt.
Wenn nur wahre Nullhypothesen vorliegen ist damit der Beweis skizziert. Weil das aber im Allgemeinen nicht der Fall ist, werden alle Variablen nach gewichteten P-Werten geordnet. Sei i
0
der erste Index aus M
0
in dieser Ordnung. Indizes vor i
0
können keinen Fehler 1. Art verursachen (,weil sie keine wahren Nullhypothesen sind). Weil der Wert von Q
i
in der Permutationsklasse nur vom Merkmal i abhängt, wird weder der Wert noch „die Reihenfolge der Q
i
untereinander für “ durch die anderen Variablen beeinflusst. Deshalb wird auch in diesem Fall das multiple Niveau eingehalten.
Die Güte der Prozedur könnte dann hoch sein, wenn, ausgehend von einer gleichmäßig niedrigen Ereignisrate aller Merkmale, diese Rate für einzelne Merkmale in einer Gruppe erhöht ist.
Literatur
- 1.
- Westfall PH, Kropf S, and Finos L Weighted FWE-controlling methods in high-dimensional situations. In Benjamini,Y., Bretz,F. and Sarkar,S.K. (eds), Recent Developments in Multiple Comparison Procedures., IML Lecture Notes - Monograph series, 47, 143-154
- 2.
- Schuster, E, Kropf, S and Roeder, I. Micro Array Based Gene Expression Analysis using Parametric Multivariate Tests per Gene - A Generalized Application of Multiple Procedures with Data-driven Order of Hypotheses. Biometrical Journal, 46, 687-696.
- 3.
- Kropf S, Läuter J, Eszlinger M, Krohn K, Paschke R. Nonparametric multiple test procedures with data-driven order of hypotheses and with weighted hypotheses. JSPI 2004; 125: 31-47