gms | German Medical Science

GMS Journal for Medical Education

Gesellschaft für Medizinische Ausbildung (GMA)

ISSN 2366-5017

Komplexität klinischer Fälle in simulierten Lernumgebungen: Vorschlag für ein Bewertungsverfahren

Kommentar Fallbasiertes Lernen

  • corresponding author Leah Theresa Braun - Ludwig-Maximilians-Universität (LMU) München, Klinikum der Universität München, Medizinische Klinik und Poliklinik IV, München, Deutschland
  • author Benedikt Lenzer - Ludwig-Maximilians-Universität (LMU) München, Klinikum der Universität München, Institut für Didaktik und Ausbildungsforschung in der Medizin, München, Deutschland
  • author Martin R. Fischer - Ludwig-Maximilians-Universität (LMU) München, Klinikum der Universität München, Institut für Didaktik und Ausbildungsforschung in der Medizin, München, Deutschland
  • author Ralf Schmidmaier - Ludwig-Maximilians-Universität (LMU) München, Klinikum der Universität München, Medizinische Klinik und Poliklinik IV, München, Deutschland

GMS J Med Educ 2019;36(6):Doc80

doi: 10.3205/zma001288, urn:nbn:de:0183-zma0012880

Dieses ist die deutsche Version des Artikels.
Die englische Version finden Sie unter: http://www.egms.de/en/journals/zma/2019-36/zma001288.shtml

Eingereicht: 15. April 2018
Überarbeitet: 24. November 2018
Angenommen: 22. Januar 2019
Veröffentlicht: 15. November 2019

© 2019 Braun et al.
Dieser Artikel ist ein Open-Access-Artikel und steht unter den Lizenzbedingungen der Creative Commons Attribution 4.0 License (Namensnennung). Lizenz-Angaben siehe http://creativecommons.org/licenses/by/4.0/.


Einführung

Diagnostizieren kann als das zielgerichtete Sammeln und Bewerten von Informationen zum Zwecke der Unsicherheitsreduktion verstanden werden, um eine klinische Entscheidung zu treffen. In der medizinischen Ausbildung können Studierende durch Simulationen an diese Aufgabe herangeführt werden: Fallbasiertes Lernen ist schon seit langem ein wichtiger Bestandteil der medizinischen Ausbildung [1]. In den meisten Curricula und in vielen Prüfungssituation ist die Arbeit an und mit klinischen Fällen ein elementarer Bestandteil. Klinische Fälle werden auch in der medizindidaktischen Forschung zum Training und zur Messung der Diagnosekompetenz eingesetzt. In Studien werden häufig standardisierte Fälle in Form virtueller Patienten [2], [3] genutzt. Zur Verbesserung der Diagnosekompetenz werden Lernende beim fallbasierten Lernen mit virtuellen Patientenfällen durch verschiedene Aufforderungen und Hilfen (sogenannte Scaffolds) unterstützt. Beispiele für Scaffoldings sind die strukturierte Reflexion [4], Feedback in unterschiedlichen Formen [5] oder Repräsentationsprompts [6]. Die Ergebnisse dieser Studien in Bezug auf die Effektivität hinsichtlich der Diagnosekompetenz der verschiedenen Interventionsmaßnahmen sind allerdings widersprüchlich. Ein Grund dafür könnte sein, dass der Komplexitätsgrad der verwendeten Fälle variiert und daher die genannten Unterstützungsmaßnahmen unterschiedlich wirksam sind.

Der Begriff komplex (aus dem Lateinischen hergeleitet von complexus, Part.adj. zu lat. complecti „umschlingen, umfassen“) bedeutet umfassend, vielfältig, verflochten, vielschichtig [https://www.dwds.de/wb/komplex, zuletzt aufgerufen am 18.11.2018]. Komplexität bezieht sich auf Systeme mit vielen Komponenten, die auf verschiedene Weisen miteinander interagieren können. Im allgemeinen Sprachgebrauch wird Komplexität oft mit Schwierigkeit gleichgesetzt. Im diagnostischen Kontext schlagen wir allerdings eine saubere Trennung der beiden Begrifflichkeiten vor (siehe Abbildung 1 [Abb. 1]):

Ein Beispiel: Eine Rechenaufgabe (Beispielsweise eine Aufgabe, in welcher der Satz von Bayes angewendet werden muss, um zum richtigen Ergebnis zu gelangen) kann unterschiedlich komplex sein. So gibt es Bayes-Aufgaben als 1-Test-Fälle [7] (z.B. Brustkrebs wird mithilfe einer Mammographie diagnostiziert) und als 2-Test-Fälle [7] (z.B. Brustkrebs wird mithilfe einer Mammographie und einer Ultraschalluntersuchung diagnostiziert). 2-Test-Fälle sind komplexer als 1-Test-Aufgaben, da sie aus mehr Ebenen bestehen und damit vielschichtiger sind, also mehr Merkmale aufweisen. Die Schwierigkeit ist aber nicht per se gleichbedeutend mit der Komplexität. So sind Bayes-Aufgaben, egal ob sie 1-Test-Fälle oder 2-Test-Fälle sind, für Mathematikstudenten problemlos zu lösen – sie sind für diese Personengruppe nicht schwierig. Für Medizinstudierende hingegen sind Bayes-Aufgaben – und zwar egal, ob es sich um 1-Test oder 2-Test-Fälle handelt, kaum zu lösen. Die Aufgaben sind schwierig für Medizinstudierende und einfach für Mathematikstudierende. Die Aufgabe an sich hat also einen bestimmten Komplexitätsgrad (1-Test-Fall = simpel/nicht-komplex und 2-Test-Fälle = komplex), die Lösungswahrscheinlichkeit und damit die Schwierigkeit ist allerdings rezipientenabhängig [8]. Das Vorwissen der bearbeitenden Person beeinflusst den Schwierigkeitsgrad viel mehr als die Komplexität.

Komplexität bezieht sich also alleine auf Merkmale des klinischen Falls und ist unabhängig von der diagnostizierenden Person. Er kann als die Vielschichtigkeit des klinischen Problems definiert werden. Schwierigkeit hingegen kann als dynamischer Begriff verstanden werden, da er unmittelbar von der diagnostizierenden Person abhängig ist: Es gibt verschiedene Faktoren, die zur Schwierigkeit beitragen: Neben dem Vorwissen und der Vorerfahrung einer Person [9] – so ist zum Beispiel ein Fall mit der Diagnose Endokarditis wahrscheinlich schwierig für einen Medizinstudierenden im ersten klinischen Jahr, aber möglicherweise sehr einfach für einen Kardiologen mit mehreren Jahren Berufserfahrung- ist auch die Motivation, die Tagesform und letztendlich auch der reine Zufall entscheidend. Hat der Arzt/die Ärztin einen ähnlichen Fall erst vor kurzem so gesehen, dann ist das klinische Problem eventuell sehr einfach für ihn zu lösen [9]. Zur Einschätzung der Fallschwierigkeit liegen schon Vergleichsstudien verschiedener Ratingsysteme vor [10].

Ursachen, die zur Komplexität der Therapie eines Patienten beitragen können, wurden schon in einigen Studien untersucht [11]. Auch die generelle Komplexitätszunahme der ärztlichen Rollen in komplexer werdenden Versorgungssystemen wurde bereits umfassend diskutiert [12]. Es gibt bisher aber kein angewandtes System zur Bestimmung der Komplexität eines klinischen Falls im fallbasierten Lernen. Dadurch ergibt sich die Problematik, dass Studienergebnisse aufgrund unterschiedlicher bzw. nicht klar definierter Fallkomplexität nur mit Einschränkungen vergleichbar sind und auch die Umsetzung der wissenschaftlichen Erkenntnisse in die Lehrpraxis erschwert wird. Auch ein differenzierter Einsatz von Fällen unterschiedlichen Komplexitätsgrades für verschiedene Expertisestufen kann ohne eine Quantifizierung der Komplexität nicht erfolgen.

In diesem Artikel soll daher die folgende Frage beantwortet werden: Wie kann der Komplexitätsgrad eines klinischen Falles für Simulationsumgebungen praktikabel und standardisiert bestimmt werden?


Methodik: Entwicklung eines literaturbasierten Modells zur Komplexität

In einer Grundlagenstudie zur Entscheidungsfindung in komplexen Szenarien nennt Payne zwei wesentliche Merkmale eines komplexen Systems: „The number of alternatives available“ sowie „number of dimensions of information available“ [13]. Diese Definition sowie eine Klassifikation zur Fallkomplexität, welche nach unseren Recherchen bisher die einzige Klassifikation in der medizindidaktischen oder medizinischen Lehrforschungsliteratur ist, die sich direkt auf die Fallkomplexität in der ärztlichen Ausbildung bezieht, sind Grundlage unseres Komplexitätsmodells: Hennen [14] schlägt einen Score vor, der aus fünf Items besteht: Symptomkomplexität, Komplexität der klinischen und technischen Befunde, sozioökonomische/verhaltensspezifische Schwierigkeiten, Diagnosekomplexität sowie Managementkomplexität. Aus einer Addition dieser Unterkategorien ergibt sich ein Komplexitätsgrad für das gesamte klinische Problem [14]. Obwohl die Kategorisierung an sich viele wichtige Aspekte umfasst, sind die einzelnen Stufen jeder Kategorie eindimensional und gehen nicht auf die im Komplexitätsbegriff benannten Verbindungen der Einzelelemente ein. Weiterhin bewertet dieses Modell [14] die Komplexität der finalen Diagnose sowie die Schwierigkeiten einer angemessenen Therapie. Diese Aspekte spielen bei der hier angewandten Definition des Diagnostizierens keine Rolle.

Das Modell musste deshalb an die Begriffsbestimmungen des klinischen Diagnostizierens angepasst werden mit einer teilweisen neuen Einteilung der Kategorien, sodass ein allgemein anwendbares Modell für klinische Fälle in simulierten Lernumgebungen entsteht. Im Folgenden wird ein Vorschlag mit fünf Kategorien beschrieben, der das Modell von Hennen an die genannten Erfordernisse anpasst. Methodisch handelt es sich dabei um eine erste Inhaltsvalidierung durch Gruppendiskussion mit Expertenkonsens als Grundlage für Studien zur externen Validität. Als Ergebnis wurden die Kategorien Körperliche Untersuchung und Technische Befunde getrennt, die beiden Kategorien Diagnose- und Managementkomplexität hingegen zusammengefasst. Das ursprünglich dreistufige Matrix-Modell wurde unter Berücksichtigung der Komplexitätsdefinition nach Payne angepasst.

Das modifizierte Scoring besteht aus fünf verschiedenen Kategorien:

1.
Anamnese,
2.
Körperliche Untersuchung,
3.
Technische Befunde,
4.
psychosoziale Aspekte und
5.
Nebendiagnosen (siehe Tabelle 1 [Tab. 1]).

Ein klinischer Patientenfall besteht in der Regel aus den folgenden drei Grundelementen: der Anamnese, einer körperlichen Untersuchung sowie technischer diagnostischer Befunde (beispielweise einem Labor, einem Röntgenbild oder einem Elektrokardiogramm (EKG) etc.). Zudem ist bei klinischen Fällen der psychosoziale Kontext, also das Verhalten und die soziale Einbindung des Patienten, wichtig. Nun kann der Komplexitätsgrad auf allen Ebenen variiert werden. Ein Fall nimmt an Komplexität zu, sobald er distrahierende Informationen enthält, welche die Anzahl an Verbindungen zwischen den Einzelelementen des Systems erhöht und damit weitere Differentialdiagnosen wahrscheinlicher macht. Erhöht sich die Anzahl der Komponenten im Modell („number of dimensions of information available“) [13], die dann wiederum miteinander interagieren, erhöht sich die Komplexität.

Wir schlagen ein 5+5-Modell vor: Je mehr Punkte, desto komplexer, also vielschichtiger ist der Fall. Das Scoring der Fälle umfasst zwei Schritte: Zuerst wird bewertet, ob der Fall Informationen aus allen fünf Kategorien erhält. Ausnahme ist hier die Kategorie Diagnose, hier wird nicht per se ein Punkt vergeben, sondern nur für jede -neben der Hauptdiagnose- weitere Nebendiagnose. Ein Fall erhält einen Punkt in einer Kategorie, sobald eine Information dazu genannt wird. Im zweiten Schritt wird die Linearität der Informationen bewertet: Falls eine Information genannt wird, die nicht linear mit der ersten Information verknüpft ist, dann erhält der Fall einen zweiten Punkt. Unter linear verstehen wir, dass die Information in der gleichen Fallebene zusammenpassen, also keine Mehr-/Vielschichtigkeit hervorrufen. Kommt nun eine dritte (vierte, fünfte) Informationsebene hinzu, die jeweils nicht mit den vorherigen Ebenen verknüpft ist, dann wird wiederum ein Punkt vergeben. Der zweite Schritt ist unabhängig von den vorher genannten Kategorien, so könnte beispielsweise ein Fall 3 zusätzliche Punkte in der Kategorie „Anamnese“ erhalten. Allgemein gesagt: Ein neuer Aspekt generiert keinen Punkt, wenn er die Linearität eines Falls nicht aufhebt, also durch die neue Information keine neue Fallebene geschaffen wird. Mehr Punkte werden hingegen vergeben, wenn eine Information nicht linear mit vorherigen Informationen verknüpft ist, sondern eine zusätzliche Komponente darstellt, die mit vielen anderen Komponenten des Systems interagiert. Hierbei kann es sich sowohl um pathologische/auffällige Befunde als auch um Normalbefunde handeln.

Ein Fall kann daher minimal einen Punkt enthalten (nur eine Anamnese) und maximal 10 Punkte. Obwohl theoretisch denkbar, ist es unwahrscheinlich, dass ein Fall, der zur studentischen Lehre eingesetzt wird, mehr als sechs zusätzliche Informationsebenen enthält, die für die klinische Entscheidungssituation in oben genannter Definition des Diagnostizierens relevant sind. Zudem ist davon auszugehen, dass auch bei realen Patientenfällen der Komplexitätsgrad nicht unendlich steigt.

Beispielhaftes Scoring eines klinischen Falls

Im Folgenden soll anhand eines Beispielfalls Pneumothorax das Scoring der Komplexität gezeigt werden. Die Lösungsrichtigkeit dieses Falls lag in einer Studie mit 150 Medizinstudierenden im klinischen Studienabschnitt bei 45% (siehe Anhang 1 [Anh. 1]).


Diskussion und Ausblick

Ziel des Scorings

Der Komplexitätsgrad eines klinischen Falls ist für Fallentwickler elementar, da klinische Fälle bewusst in ihrer Komplexität variiert werden können, um sie für eine bestimmte Zielgruppe passend zu gestalten. Mit zunehmendem Ausbildungsgrad sollten Studierende mit immer komplexeren Fällen und abnehmenden Unterstützungsmaßnahmen konfrontiert werden. Für alle Studien, in denen klinische Fälle verwendet werden, wäre zu fordern: Der Komplexitätsgrad des Falls sollte in einer standardisierten Weise beschrieben werden. Ziel sollte sein, dass Ergebnisse von Interventionsstudien Forschergruppen-übergreifend vergleichbar sind.

Komplexität und Schwierigkeit

In weiteren Studien sollte der Einfluss der Komplexität auf die Fallschwierigkeit genauer untersucht werden, wobei die Richtigkeit nicht nur durch Genauigkeit des Diagnoseergebnisses, sondern auch durch andere abhängige Variablen wie Diagnoseeffizienz oder Fehlerarten beschrieben werden sollte [6], [15]. Diagnostizieren ist schwierig. Jede zehnte Diagnose ist eine Fehldiagnose [16], [17]. Generell gibt es zwei Fehlerquellen: mangelndes Wissen und mangelnde Informationsverarbeitung. Der Komplexitätsgrad könnte insbesondere Fehler aufgrund von falscher Informationsverarbeitung bedingen. Dies ist insbesondere wichtig, wenn in einem Fall mehrere Differentialdiagnosen denkbar sind oder der Patient verschiedene klinische Probleme hat, die korrekt gewichtet werden müssen. Inwiefern der Komplexitätsgrad eines klinischen Falls zur Schwierigkeit beiträgt, ist unklar.

Ausblick: Validierung des Modells und Modulation der Komplexität

Ziel dieser Arbeit und der Arbeitsgruppe ist es, ein Instrument zur Bewertung der Fallkomplexität zu entwickeln, um diese wichtige Falleigenschaft korrekt beschreiben und entsprechende Fälle gezielt für Lehre und Forschung einsetzen zu können. Ob das vorgeschlagene Scoring-System die Komplexität klinischer Fälle für simulationsbasierte Lernumgebungen zuverlässig messen kann, muss in Validierungsstudien überprüft werden. Laut dem an Kane angelehnten Validierungsinstrument von Cook et. al. beschreibt dieser Kommentar den Beginn eines Validierungsprozess („articulating the claims and assumptions associated with the proposed decision (the interpretation/use argument)“) [18]. Im weiteren Verlauf muss nun Evidenz generiert werden, denn es gilt: „Just as one can never prove a hypothesis, validity can never be proven; but evidence can, as it accumulates, support or refute the validity argument.” [19]. Generalisierbarkeit und Praktikabilität des Scoringsystems sollen mit einem mehrstufigen Experten-Review mit Hilfe der Angoff-Methode [20] überprüft werden.

Ziel wäre es, die jetzt 10-teilige Skala in Abschnitte zu gliedern: wenig komplex, mäßig komplex, sehr komplex. In diesem Zusammenhang ist auch zu prüfen, ob bei gleichbleibender Expertisestufe durch Komplexitätsmodulation des Falles die Schwierigkeit beeinflusst wird. Offen bleibt außerdem, ob es weitere Aspekte gibt, die in den Komplexitätsgrad einfließen, von dem Modell allerdings noch nicht erfasst werden. Ob und inwiefern das Modell auch auf andere Themenfelder und Berufsgruppen, beziehungsweise generell auf Problemlöseaufgaben übertragbar ist, ist ein weiterer wesentlicher Aspekt für zukünftige Validierungsstudie.

Für Rückmeldungen anderer Forscher zur Praktikabilität und Validität unseres Bewertungsmodells wären wir dankbar.


Interessenkonflikt

Die Autoren erklären, dass sie keine Interessenkonflikte im Zusammenhang mit diesem Artikel haben.


Literatur

1.
Cabot RC. Case teaching in medicine. Lexington: DC Heath & Company; 1906.
2.
Huwendiek S, De leng BA, Zary N, Fischer MR, Ruiz JG, Ellaway R. Towards a typology of virtual patients. Med Teach. 2009;31(8):743-748. DOI: 10.1080/01421590903124708 Externer Link
3.
Kononowicz AA, Zary N, Edelbring S, Corral J, Hege I. Virtual patients--what are we talking about? A framework to classify the meanings of the term in healthcare education. BMC Med Educ. 2015;15:11. DOI: 10.1186/s12909-015-0296-3 Externer Link
4.
Mamede S, Van Gog T, Sampaio AM, De Faria RMD, Maria JP, Schmidt HG. How can students' diagnostic competence benefit most from practice with clinical cases? The effects of structured reflection on future diagnosis of the same and novel diseases. Acad Med. 2014;89(1):121-127. DOI: 10.1097/ACM.0000000000000076 Externer Link
5.
Kopp V, Stark R, Fischer MR. Fostering diagnostic knowledge through computer-supported, case-based worked examples: effects of erroneous examples and feedback. Med Educ. 2008;42(8):823-829. DOI: 10.1111/j.1365-2923.2008.03122.x Externer Link
6.
Braun LT, Zottmann JM, Adolf C, Lottspeich C, Then C, Wirth S, Fischer MR, Schmidmaier R. Representation scaffolds improve diagnostic efficiency in medical students. Med Educ. 2017;51(11):1118-1126. DOI: 10.1111/medu.13355 Externer Link
7.
McDowell M, Jacobs P. Meta-analysis of the effect of natural frequencies on Bayesian reasoning. Psychol Bull. 2017;143(12):1273-1312. DOI: 10.1037/bul0000126 Externer Link
8.
Binder K, Krauss S, Bruckmaier G, Marienhagen J. Visualizing the Bayesian 2-test case: The effect of tree diagrams on medical decision making. PloS One. 2018;13(3):e0195029. DOI: 10.1371/journal.pone.0195029 Externer Link
9.
Elstein AS, Shulman LS, Sprafka SA. Medical problem solving an analysis of clinical reasoning. Cambridge (Mass): Havard University Press; 1978. DOI: 10.4159/harvard.9780674189089 Externer Link
10.
Koskinen H. Evaluation of the level of difficulty of patient cases for veterinary problem-solving examination: a preliminary comparison of three taxonomies of learning. J Vet Med Educ. 2007;34(2):106-111. DOI: 10.3138/jvme.34.2.106 Externer Link
11.
Safford MM, Allison JJ, Kiefe CI. Patient complexity: more than comorbidity. The vector model of complexity. J Gen Intern Med. 2007;223 Suppl 3:382-390. DOI: 10.1007/s11606-007-0307-0 Externer Link
12.
Plsek PE, Greenhalgh T. Complexity science: The challenge of complexity in health care. BMJ. 2001;323(7313):625. DOI: 10.1136/bmj.323.7313.625 Externer Link
13.
Payne JW. Task complexity and contingent processing in decision making: An information search and protocol analysis. Organ Behav Human Perform. 1976;16(2):366-387. DOI: 10.1016/0030-5073(76)90022-2 Externer Link
14.
Hennen BK. Measuring the complexity of clinical problems. Acad Med. 1984;59(6):487-493. DOI: 10.1097/00001888-198406000-00005 Externer Link
15.
Braun LT, Zwaan L, Kiesewetter J, Fischer MR, Schmidmaier R. Diagnostic errors by medical students: results of a prospective qualitative study. BMC Med Educ. 2017;17(1):191. DOI: 10.1186/s12909-017-1044-7 Externer Link
16.
Graber ML, Carlson B. Diagnostic error: the hidden epidemic. Physician Exec. 2011;37(6):12-14, 16, 18-19.
17.
Graber ML. The incidence of diagnostic error in medicine. BMJ Qual Saf. 2013:22 Suppl 2:ii21-ii27. DOI: 10.1136/bmjqs-2012-001615 Externer Link
18.
Cook DA, Brydges R, Ginsburg S, Hatala R. A contemporary approach to validity arguments: a practical guide to Kane's framework. Med Educ. 2015;49(6):560-575. DOI: 10.1111/medu.12678 Externer Link
19.
Cook DA, Hatala R. Validation of educational assessments: a primer for simulation and beyond. Adv Simul (London). 2016;1:31. DOI: 10.1186/s41077-016-0033-y Externer Link
20.
Jalili M, Hejri SM, Norcini JJ. Comparison of two methods of standard setting: the performance of the three-level Angoff method. Med Educ. 2011;45(12):1199-1208. DOI: 10.1111/j.1365-2923.2011.04073.x Externer Link