GMS | MAINZ//2011: 56. GMDS-Jahrestagung und 6. DGEpi-Jahrestagung | Von der Signifikanz zur klinischen Relevanz. Vor- und Nachteile unterschiedlicher Ergebnisdarstellung statistischer Daten aus medizinischer Evaluation

MAINZ//2011: 56. GMDS-Jahrestagung und 6. DGEpi-Jahrestagung

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V.
Deutsche Gesellschaft für Epidemiologie e. V.

26. - 29.09.2011 in Mainz

Artikel

XML Version

Artikel empfehlen

Von der Signifikanz zur klinischen Relevanz. Vor- und Nachteile unterschiedlicher Ergebnisdarstellung statistischer Daten aus medizinischer Evaluation

Meeting Abstract

Suche in Medline nach

Bernd Röhrig - Medizinischer Dienst der Krankenversicherung Rheinland-Pfalz (MDK), Alzey
Manfred Nosper - Medizinischer Dienst der Krankenversicherung Rheinland-Pfalz (MDK), Alzey

Mainz//2011. 56. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds), 6. Jahrestagung der Deutschen Gesellschaft für Epidemiologie (DGEpi). Mainz, 26.-29.09.2011. Düsseldorf: German Medical Science GMS Publishing House; 2011. Doc11gmds537

doi: 10.3205/11gmds537, urn:nbn:de:0183-11gmds5370

Veröffentlicht:	20. September 2011

© 2011 Röhrig et al.
Dieser Artikel ist ein Open Access-Artikel und steht unter den Creative Commons Lizenzbedingungen (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.de). Er darf vervielfältigt, verbreitet und öffentlich zugänglich gemacht werden, vorausgesetzt dass Autor und Quelle genannt werden.

Gliederung

Text

Einleitung: Die Ergebnisse medizinischer Wirksamkeitsprüfungen müssen so dargestellt werden, dass ihr Nutzen erkennbar wird. Ziel der Präsentation ist es, unterschiedliche Möglichkeiten der statistischen Ergebnisdarstellung vorzustellen und deren Vor- und Nachteile zu diskutieren.

Material und Methoden: Die verschiedenen Auswertestrategien werden am Beispiel von Evaluationsdaten von 13 stationären kardiologischen Rehabilitationseinrichtungen vorgestellt. Beispielhaft wird dies an der Veränderungen der ‚Herzfrequenz in Ruhe’ im Vergleich Beginn und Ende der Rehabilitation gezeigt (N=1728).

Ergebnisse: Der individuelle Rehabilitationserfolg wird als Differenz der Patientenwerte zu Beginn und zum Ende der Rehabilitationsmaßnahme berechnet (Vorher-Nachher-Erhebung). Informationen über die Verteilung werden mittels statistischer Maßzahlen dargestellt (Deskriptive Statistik). Die Verteilungen werden durch Lagemaße (z.B. Mittelwert, Median), Streumaße (z.B. Standardabweichung, Interquartilabstand) und Extremwerte (z.B. Minimum, Maximum) beschrieben. [Rehabeginn: MW:76,2 SD:14,7; Rehaende: MW:69,6 SD:11,0; Differenz: MW:-6,5 SD:13,1]. Ob die (mittlere) Veränderung vom Zufall zu unterscheiden ist (statistische Signifikanz), wird mit einem statistischen Test geklärt. Der p-Wert ist jedoch von der Fallzahl abhängig und bei genügend großer Fallzahl können selbst kleinste, medizinisch nicht relevante Unterschiede signifikant werden. Um die Abhängigkeit von der Fallzahl zu überwinden, schlägt Cohen die Berechnung von Effektstärken vor. Sowohl Signifikanztests als auch Effektstärken liefern für die Beispielpopulation eine ‚mittlere Erfolgseinschätzung’, [p-Wert:<0,001, Effektstärke: 0,44], jedoch keine Aussagen über den individuellen Therapieerfolg. Zur Beurteilung, ob die Maßnahme eine medizinisch bedeutsame Verbesserung bringt, muss im Voraus eine Grenze festgelegt werden (klinische Relevanz). Überschreitet der Patient mit seinem Ergebnis diese Grenze, dann hat er sich klinisch relevant verbessert, d.h. die Therapie war erfolgreich. Durch Angabe des prozentualen Anteils der gebesserten Fälle kann der Erfolg einer Therapie evaluiert werden. Bei der klinischen Bewertung der Veränderung werden Schweregradgruppen für die Messwerte zu Beginn und zum Ende aufgrund medizinischer Kriterien gebildet. Ändert sich durch die Therapie die Kategorie von einer ungünstigeren zu einer günstigeren, so gibt es einen Punktgewinn, ansonsten einen Punktabzug. Patienten mit Normwerten ohne Interventionsbedarf werden in die Ergebnisbewertung nicht einbezogen. In der untersuchten Population waren gemessen am vordefinierten Relevanzkriterium 2,8% verschlechtert, 66,3% unverändert und 30,9% verbessert.

Schlussfolgerungen: Die Einführung eines medizinisch begründeten Relevanzkriteriums erlaubt die Bewertung des Therapieerfolgs und die Bestimmung des Anteils verschlechterter, unveränderter, gebesserter und sehr gebesserter Fälle. Dies hat gegenüber der Angabe von Mittelwertdifferenzen und Effektstärken den Vorteil, dass die Relevanz der Veränderungswerte deutlich wird und die Zahl der Fälle benannt wird, die von einem Treatment nicht oder gut profitieren. Während die Effektstärke (ES=0,44) mit einem mittleren Effekt ein ausreichendes Ergebnis beschreibt, macht die Angabe von 2,8 und 66,3 Prozent nicht gebesserter Fälle deutlich, dass ein hohes Verbesserungspotential besteht.

Gliederung

Literatur

1.: Spriestersbach A, Röhrig B, du Prel JB, Gerhold-Ay A, Blettner M. Descriptive statistics: The specification of statistical measures and their presentation in tables and graphs – Part 7 of a Series on Evaluation of Scientific Publications. Dtsch Arztebl Int. 2009;106(36):578-83.
2.: Wittmann WW, Nübling R, Schmidt J. Evaluationsforschung und Programmevaluation im Gesundheitswesen. Zeitschrift für Evaluation. 2002;1:39-60.

gms | German Medical Science

MAINZ//2011: 56. GMDS-Jahrestagung und 6. DGEpi-Jahrestagung

Artikel

Von der Signifikanz zur klinischen Relevanz. Vor- und Nachteile unterschiedlicher Ergebnisdarstellung statistischer Daten aus medizinischer Evaluation

Suche in Medline nach

Autoren

Gliederung

Text

Literatur