Artikel
Ein global konvergierender EM-Algorithmus für semiparametrische Mischverteilungsmodelle mit Kovariaten
Suche in Medline nach
Autoren
Veröffentlicht: | 14. September 2004 |
---|
Gliederung
Text
Einleitung
Semiparametrische Mischverteilungsmodelle sind ein wichtiges statistisches Verfahren zur Analyse unbeobachteter Heterogenität, das durch die Annahme einer diskreten mischenden Verteilung zugleich die Klassifikation der individuellen Beobachtung erlaubt. Vielfach stellt sich die Frage, ob beobachtete Kovariate einen Teil der unbeobachteten Heterogenität aufklären können, wie z.B. in der Meta-Analyse klinischer oder epidemiologischer Studien [Ref. 1].
Methoden
Das Standardverfahren zur Schätzung der Parameter semiparametrischer Mischverteilungsmodelle ist der EM-Algorithmus [Ref. 2]. Hier wird im E(wartungswert)-Schritt die a-posteriori Wahrscheinlichkeit der Zugehörigkeit der jeweiligen Beobachtung zur latenten Klasse geschätzt. Im M(aximierungs)-Schritt wird der Anteilswert der jeweiligen Klasse und die Parameter der jeweiligen Subpopulation geschätzt. Dies läßt sich leicht auf Kovariate erweitern, indem im M-Schritt die Parameter des populationsspezifischen Regressionsmodells geschätzt werden.. Eine Schwierigkeit besteht darin, daß der EM-Algorithmus oft nur zu einem lokalen Maximum konvergiert. Für den Fall ohne Kovariate schlägt Böhning [Ref. 3] einen global konvergenten EM-Algorithmus vor, der auf dem Maximum des Gradienten der Richtungsableitung des Likelihoods beruht und den Parameterwert mit minimalem Gradienten gegen denjenigen mit maximalem Gradienten austauscht Wert. Im Fall ohne Kovariate ist das Maximum leicht zu finden. Im Fall mehrerer Kovariate sind deterministische Optimierungsalgorithmen nur bedingt anwendbar. Deshalb wir hier ein global konvergenter EM-Algorithmus vorgestellt, der das Maximum des Gradienten mit Hilfe von Simulated Annealing sucht. Auf diese Weise wird ein global konvergierender EM-Algorithmus für semiparametrische Mischverteilungen mit Kovariaten konstruiert.
Ergebnisse
Die Ergebnisse des Standard-EM und des global konvergenten Algorithmus werden anhand einer Meta-Analyse von epidemiologischen Studien zur Hormonersatztherapie vorgestellt.
Diskussion
Der vorgestellte, global konvergente Algorithmus bietet in der Auswertung praktischer Daten den Vorteil, daß die Verwendung verschiedener Kombinationen von Startwerten entfällt, um Konvergenz zu lokalen Minima aufzuspüren.
Literatur
- 1.
- Blettner M, Schlattmann Meta-Analysis. In: Pigeot I, Ahrens W Hrsg., Handbook of Epidemiology Berlin, Springer, 2004. (im Druck)
- 2.
- McLachlan G J.; Krishnan T. The EM algorithm and extensions, Wiley Series in Probability and Mathematical Statistics. Applied Probability and Statistics. New York, NY: John Wiley & Sons; 1997
- 3.
- Böhning D. The EM-Algorithm with Gradient Function Update for Discrete Mixtures with Fixed (Known) Number of Components. Statistics and Computing 2003; 13: 257-265