gms | German Medical Science

17. Deutscher Kongress für Versorgungsforschung

Deutsches Netzwerk Versorgungsforschung e. V.

10. - 12.10.2018, Berlin

Deterministische Methode für das Exact 1:1 Matching, die die Nachteile des Propensity Score Matchings vermeidet – dargestellt an einem Datensatz zur externen Qualitätssicherung

Meeting Abstract

Search Medline for

  • Maike Bestehorn - ProMedCon GmbH, Gesundheitsforschung, Zell/Schäftlarn
  • Felix Bestehorn - Technische Universität Braunschweig, Institut für mathematische Optimierung, Braunschweig

17. Deutscher Kongress für Versorgungsforschung (DKVF). Berlin, 10.-12.10.2018. Düsseldorf: German Medical Science GMS Publishing House; 2018. Doc18dkvf026

doi: 10.3205/18dkvf026, urn:nbn:de:0183-18dkvf0267

Published: October 12, 2018

© 2018 Bestehorn et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License. See license information at http://creativecommons.org/licenses/by/4.0/.


Outline

Text

Hintergrund: Beim Vergleich kausaler Effekte zweier Therapien werden regelmäßig Matchings möglichst „ähnlicher“ Patienten gebildet und das Outcome der Therapien für die beiden Patientengruppen verglichen. Sehr häufig wird dafür ein Propensity-Score Matching durchgeführt. „Ähnlichkeit“ wird dabei dadurch definiert, dass sich der Propensity-Score (PS) eines gematchten Patientenpaares nicht oder nur so wenig wie möglich unterscheidet. Bei ausreichend großen Datensätzen der Versorgungsforschung kann häufig eine ausreichend große Anzahl an Patientenpaaren gefunden werden, bei denen die gematchten Patienten eines Matching-Paares exakt die gleichen PS Werte besitzen. Dieses Verfahren wurde für den Datensatz für chirurgische (SAVR) und transfemorale (TF) isolierte Aortenklappenimplantation der externen Qualitätssicherung angewendet, wobei die Krankenhausmortalität der beiden Therapieverfahren verglichen werden sollte. Dabei stellten sich inhärente Nachteile des PS-Verfahrens heraus, die durch eine neue Methode [1] (finest balancing score algorithm [FBSA]) vermieden werden.

Fragestellung: Entwicklung einer Methode, die die Nachteile des PS-Matching vermeidet, vorhandene Information optimal ausnutzt und eindeutige, reproduzierbare Ergebnisse liefert.

Methode: Die neue Methode FBSA beruht auf folgendem Algorithmus:

1.
Fälle mit gleichem PS werden sowohl für die TF als auch die SAVR-Kohorte zu Clustern zusammengefasst.
2.
Das Matching wird auf Clusterebene durchgeführt.
3.
Da die Cluster eines gleichen PS für TF bzw. SAVR von unterschiedlicher Mächtigkeit [M(TF) bzw. M(SAVR)] sein können, muss auf gleiche Mächtigkeit gewichtet werden, um Ergebnisse der Kohorten vergleichen zu können.
4.
Die Gewichtung min(M(TF); M(SAVR))/M(TF) für TF-Cluster und min(M(TF);M(SAVR))/M(SAVR) für SAVR-Cluster führt zu einer Fallgewichtung, die dem Erwartungswert aller möglichen exakten 1:1 Matchings entspricht [1].

Ergebnisse: Der Datensatz enthielt 9.848 SAVR und 7.579 TF-Fälle. Basis des PS war die logistische Regression der Zielvariablen Therapiemethode (SAVR oder TF) über bestimmte Zustandsvariablen der Patienten (im Beispiel die EuroScore II-Variablen wie z.B. Alter, Geschlecht, Diabetes, Niereninsuffizienz, NYHA-Klassen …). Beim exakten Matching lassen sich je Matching genau 1502 Paare bilden (d.h. 15,3% der SAVR-Fälle, 19,8% TF-Fälle), allerdings in so vielen Kombinationen, dass in einer sinnvollen Bearbeitungszeit die Erzeugung und Auswertung aller Matchings unmöglich ist. Im Vortrag werden für den oben genannten Datensatz mögliche Ergebnisse des exakten PS-Matchings dargestellt. Wegen des gleichen PS sind bei jedem exakten 1:1 Matching die standardisierten Differenzen aller im PS genutzten Variablen gleich null, d.h. die PS-Matching-Kohorten sind „balanziert“ [1]. Es zeigt sich, dass bei gleichem Datensatz und exaktem 1:1 Matching völlig konträre Ergebnisse erzeugt werden können, weil a) aufgrund der Randomisierungsmodule in den PS-Verfahren mehrere PS-Matchings zu deutlich unterschiedlichen Ergebnissen führen können, b) aus dem Gesamtdatensatz nur die Information eines einzigen zufälligen Matchings im Ergebnis berücksichtigt wird und nicht die Ergebnisse aller möglichen exakten 1:1 Matchings, c) die erzeugten Matchings durch die Sortierreihenfolge des Datensatzes beeinflusst werden können und d) gezielt exakte 1:1 Matchings ausgewählt werden können, die ein bestimmtes Ergebnis unterstützen.

Beim FBSA gab es im Beispieldatensatz genau 1502 TF-Cluster mit einem Matchingcluster für SAVR. Durch die Clusterbildung finden 3.361 SAVR Fälle und 2.249 TF-Fälle mindestens einen Matchingpartner, d.h. die Informationen von 34,1% der SAVR-Fälle und 29,6% der TF-Fälle gehen in den Therapievergleich ein. Die gewichtete Krankenhausmortalität, die dem Erwartungswert aller möglichen exakten 1:1 Matchings entspricht, beträgt 3,5% für SAVR und 2,1% für TF.

Diskussion: Die sehr häufig angewendete Methode des PS-Matchings liefert nur zufällige Ergebnisse, deren Gütebeurteilung im Hinblick auf den „wahren“ Ergebnisvergleich der (Therapie-) Effekte nicht beurteilt werden kann. Die Zufälligkeit führt zu schwer reproduzierbaren, u.U. konträren Ergebnissen. Das ausgewählte PS-Matching für den (Therapie-)Effektvergleich nutzt nur einen Bruchteil der insgesamt verfügbaren Information.

Praktische Implikationen: Die neue Methode ist deterministisch, damit reproduzierbar und eindeutig und liefert kein zufälliges Ergebnis aus einem Datensatz. FBSA nutzt die Information aller Fälle, für die mindestens ein exakter Matchingpartner existiert und nicht nur das Ergebnis eines einzigen (zufälligen) PS-Matchings. Das Ergebnis entspricht dem Erwartungswert aller möglichen exakten 1:1 PS-Matchings des zugrundeliegenden Datensatzes.


Literatur

1.
Bestehorn F, et al. A finest balancing score algorithm to avoid common pitfalls of propensity score matching. arXiv:1803.02704 [stat.AP]. Sep 2018.