gms | German Medical Science

GMS Zeitschrift für Medizinische Ausbildung

Gesellschaft für Medizinische Ausbildung (GMA)

ISSN 1860-3572

Positionspapier der nordrhein-westfälischen Studiendekane zur hochschulvergleichenden leistungsorientierten Mittelvergabe für die Lehre

Distribution of government funds according to teaching performance

Projekt Humanmedizin

  • corresponding author Stefan Herzig - Universität zu Köln, Institut für Pharmakologie, Köln, Deutschland
  • author Bernd Marschall - Westfälische Wilhelms-Universität Münster, Klinik und Poliklinik für Allgemeine Chirurgie, Münster, Deutschland
  • author Dieter Nast-Kolb - Universitätsklinikum Essen, Klinik für Chirurgie, Essen, Deutschland
  • author Sibylle Soboll - Heinrich-Heine Universität Düsseldorf, Medizinische Fakultät, Studiendekanat, Düsseldorf, Deutschland
  • author Lars Christian Rump - Ruhr-Universität Bochum, Medizinische Fakultät, Klinikum, Marienhospital Herne, Medizinische Klinik I, Bochum, Deutschland
  • corresponding author Ralf-Dieter Hilgers - Rheinisch-Westfälische Technische Hochschule Aachen, Institut für Medizinische Statistik, Aachen, Deutschland

GMS Z Med Ausbild 2007;24(2):Doc109

The electronic version of this article is the complete one and can be found online at: http://www.egms.de/en/journals/zma/2007-24/zma000403.shtml

Received: March 4, 2007
Published: May 23, 2007

© 2007 Herzig et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution License (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en). You are free: to Share – to copy, distribute and transmit the work, provided the original author and source are credited.


Zusammenfassung

In Nordrhein-Westfalen wurde bislang der auf die Lehre bezogene Anteil leistungsbezogener Landesmittel auf Grundlage der jeweiligen Staatsexamensergebnisse vergeben. Durch die Änderung der Approbationsordnung sowie die Einführung mehrerer Modellstudiengänge im Land wurde diese Bemessungsgrundlage erheblich geschmälert. Eine Arbeitsgruppe der Studiendekane entwarf daher als Diskussionsvorlage für das Ministerium einen neuen Bemessungs- und Verteilungsalgorithmus, der neben Studienverlaufs-bezogenen Ergebnisparametern (Examensergebnis, Studiendauer, Schwund) auch Studiengangs-bezogene Prozess- und Strukturparameter (Evaluationsbezogene interne Mittelvergabe, Lehrpersonalentwicklung, Finanzierung begutachteter Lehrprojekte, usw.) berücksichtigt. Der Artikel beschreibt diesen konsensuell erarbeiteten Entwurf und diskutiert dabei die generellen Chancen und Risiken einer auf die Lehre angewandten leistungsbezogenen Mittelvergabe.

Schlüsselwörter: Leistungsorientierte Mittelvergabe, Ergebnis, Prozess, Struktur

Abstract

In the past, the ministry of science of North Rhine-Westphalia distributed part of its funding of the medical faculties based on exam results of their graduates. Due to legal and curricular changes, this procedere appeared to be no longer tenable. Therefore, the Deans for Medical Education convened to elaborate and agree upon a new algorithm, to be presented and proposed to the ministry. The new algorithm incorporated outcome parameters of the graduates (grades, duration, loss), together with process- and structure-related parameters (evaluation-based internal fund redistribution, teacher training, funding of peer-reviewed teaching projects, etc.) of the respective universities and their curricula. We describe the consented proposal and discuss the general risks and potential benefits of performance-based funding for medical faculties.

Keywords: performance-based funding, outcome, process, structure


Einleitung

Einhergehend mit der zunehmenden Ressourcenverknappung der öffentlichen Haushalte wächst die Diskussion über Art und Umfang von leistungsorientierten Mittelzuwendungen, auch in Bezug auf die medizinische Lehre. Dieser Trend entspricht den Empfehlungen der Rambøll-Studie [1], die unter anderem stärkere Leistungsanreize für die Universitäten fordert, um die Studienbedingungen zu verbessern.

Seit Ende der neunziger Jahre wird ein wachsender Teil der Zuführungsbeträge für die Hochschulmedizin in Nordrhein-Westfalen leistungsorientiert umverteilt. Der für die Lehre ausgewiesene Anteil dieser leistungsorientierten Mittelvergabe (LOM) basiert hierbei ausschließlich auf den Prüfungsergebnissen der bundesweiten Staatsexamina.

Im Rahmen der Einführung der 9. Novelle der Approbationsordnung wird seit 2003 das zentrale Prüfungswesen weit reichend geändert, verbunden mit einer Reduktion und zeitlichen Verlagerung der zentralen Prüfungen. Zudem nutzen derzeit drei der sieben staatlichen Hochschulen im Land die Modellklausel (§ 41 ÄAppO) dahingehend, dass dort das neue zentrale erste Staatsexamen teilweise oder ganz ersetzt wird. Mithin fallen von vormals drei bundesweit vergleichbaren Bezugspunkten in Nordrhein-Westfalen zwei für die Bemessung der künftigen LOM fort. Der verbleibende Bezugspunkt (schriftlicher Teil des neuen zweiten Staatsexamens) findet zu einem veränderten Zeitpunkt nach dem Praktischen Jahr statt und ist hinsichtlich formaler Ausgestaltung und curricularer Bezugsetzung grundlegend reformiert. Unter diesen Rahmenbedingungen erscheint eine grundlegende Diskussion der für die LOM zugrunde zu legenden Kriterien geboten. Abbildung 1 [Abb. 1] illustriert Teile des Problems anhand der größeren Varianz über die Zeit, wenn statt kumulierter Daten über mehrere Examina (siehe Abbildung 1 (A)) lediglich Einzeldaten für die jeweiligen Hochschulen (siehe Abbildung 1(B-D)) zugrunde gelegt werden könnten.

Die bisherige Ansatz zur Leistungsabhängigen Mittelvergabe auf der Basis des IMPP Ergebnisses erschien nicht mehr zeitgemäß, beispielsweise aufgrund des fehlenden Einflusses der vorklinischen Ausbildung am Ergebnis des Erfolgskriteriums (neues Staatsexamen), der unterschiedlichen Curricula, und der hohen Rate an Ortswechslern vor dem PJ. Deshalb sollte ein neuer Kriterienkatalog zur Leistungsabhängigen Mittelvergabe im Bereich der Lehre zwischen den Fakultäten in NRW entwickelt werden. Nach Vorgesprächen im Ministerium für Wissenschaft und Forschung des Landes NRW mit den Studiendekanen der 7 Medizinischen Fakultäten (Aachen, Bochum, Bonn, Düsseldorf, Essen, Köln, Münster) wurde eine Arbeitsgemeinschaft beauftragt, einen neuen Kriterienkatalog zu formulieren.


Methode

Nach Einzelgesprächen des Ministeriums für Wissenschaft und Forschung mit den Fakultäten und einer gemeinsamen Gesprächsrunde im Juni 2004 konstituierte sich ein Arbeitskreis aus Vertretern aller genannten Einrichtungen. Allgemeine Zielsetzung war es, ein zukunftstaugliches Bemessungssystem für die leistungsorientierte Mittelvergabe für die Lehre zu erarbeiten und zu konsentieren. Der Arbeitskreis traf sich sechsmal im Laufe eines Jahres und berichtete abschließend auf der Konferenz der Studiendekane im Juni 2005. Dort wurde beschlossen, das Arbeitsergebnis in der hier vorliegenden Form zu veröffentlichen.

Die dem Arbeitskreis vom Ministerium vorgelegte Aufgabe umfasste die Erarbeitung eines reformierten Algorithmus für die LOM des Landes für den Bereich der Lehre. Es sollte dabei den geänderten Rahmenbedingungen durch die 9. Novelle der Approbationsordnung sowie der zunehmenden Diversifizierung der Studienbedingungen an den Fakultäten Rechnung getragen werden. Das zu erarbeitende Instrument sollte sich anhand der folgenden Zielkriterien orientieren:

  • die Einfachheit bei der Erhebung und Berechnung
  • eine gute Vergleichbarkeit der maßgeblichen Faktoren
  • eine nachvollziehbare Messbarkeit der zugrunde liegenden Parameter
  • eine hohe Transparenz
  • und einer damit möglichen Diskriminierung zwischen den Fakultäten.

Nach Sondierung anderer etablierter Verfahren und Diskussion der bisherigen eigenen Erfahrungen wurden zunächst zahlreiche denkbare Qualitäten an Parametern vergleichend in Betracht gezogen und auf mögliche Konsensfähigkeit geprüft. Nach Eingrenzung auf einen überschaubaren, die genannten Zielvorgaben erfüllenden Satz von Parametern wurde deren mögliche Anwendung und Gewichtung diskutiert und die Folgenlastigkeit anhand einer Modellrechnung (basierend auf Schätzwerten des aktuellen Jahres) dargestellt. Die Protokolle wurden jeweils den Studiendekanen – soweit nicht persönlich im Arbeitskreis vertreten – schriftlich vorgelegt.


Ergebnisse

Die Grundlage für die Diskussion bildeten der Bericht der Sachverständigenkommission zur Bewertung der Medizinischen Ausbildung in Baden-Württemberg [2], die „Global Standards for Quality Improvement” [3], sowie die Empfehlungen des Wissenschaftsrates zur Stärkung der Lehre durch Evaluation [4]. In einem ersten Ansatz wurde zwischen drei Qualitätsebenen unterschieden.

Zunächst wurde festgestellt, dass die Qualität eines Ausbildungsprozesses wesentlich durch die Struktur beeinflusst wird. Die Struktur wiederum ist gekennzeichnet durch die Gesamtheit der materiellen und personellen Ressourcen, die zur Erbringung der Lehre verfügbar sind sowie die gesetzlichen und organisatorischen Regelungen, die die Rahmenbedingungen vorgeben. Diese strukturellen Komponenten werden im Wesentlichen durch das Ministerium, die Hochschule und die Fachbereiche bestimmt.

Die nächste Ebene lässt sich als Prozess der Ausbildung beschreiben, der durch die inhaltliche und didaktische Gestaltung von Lehrveranstaltungen, Sprechstunden und Prüfungen charakterisiert wird. Hier wird die Qualität vor allem durch die Interaktionen, die im Zuge einer Leistungserbringung stattfinden, sowie die Beziehungen zwischen Anbietern und Nutznießern gekennzeichnet.

Schließlich läßt sich auf der letzten Ebene das Ergebnis des Ausbildungsprozesses beschreiben. Diese Qualitätsdimension beschreibt den Erwerb von Fachwissen, die Vermittlung wissenschaftlicher Arbeitsmethoden oder die Berufsfähigkeit von Absolventen (Lernerträge).

Bei der Beschreibung des Ausbildungsprozess unter den vorgenannten Aspekten muss jedoch beachtet werden, dass einerseits die Prozessqualität von Anbietern (Dozenten) und Nutznießern (Studierenden) gemeinsam gestaltet wird und andererseits wesentliche Aspekte der Ergebnisqualität erst beobachtet werden können, wenn die Lernenden die Bildungsinstitution bereits verlassen haben. Für die Beschreibung struktureller Aspekte kann auf die finanziellen Rahmenbedingungen (Zuführung der Medizinischen Fakultäten) zurückgegriffen werden, die jedoch in Ihrer Höhe limitiert sind. Ferner kann die Qualität des Ausbildungsprozesses durch eine Studentische Veranstaltungskritik und das Ergebnis der Ausbildung durch die Examensergebnisse beschrieben werden.

Insgesamt stellt sich die Frage, in welcher Beziehung diese Ebenen der Qualität zueinander stehen, d.h. ob die Annahme gerechtfertigt ist, dass eine hohe Strukturqualität eine hohe Prozessqualität ermöglicht und insofern zu guten Ergebnissen führt. Dies wird vielfach kritisch diskutiert. Konsens war jedoch, dass Verbesserungen im Bereich des Ausbildungsprozesses sich nicht auf der Basis der Optimierung einzelner Aspekte des Ausbildungsprozesses alleine erzielen lassen, sondern hier mehrere Ebenen gleichzeitig zu optimieren sind.

In intensiven Diskussion wurden drei Parameter (Studienergebnis, Studiendauer und Retentionsrate) herausgearbeitet, anhand derer zunächst die Ergebnisqualität beurteilt werden soll. Diese werden im Folgenden näher erläutert:

Ergebnisqualität: Bisher wurde das IMPP Ergebnis als alleinige Basis einer LOM verwendet. Wird nun der leistungsabhängige Anteil der Zuführung über eine kritische Grenze angehoben, so würden die Fachbereiche in einem verschärften kompetitiven Wettbewerb dazu übergehen müssen, das Ergebnis des IMPP zu maximieren. Dies kann sicherlich zielgerichteter durch „Testtraining“ erreicht werden, als durch ein verbessertes Curriculum. Ferner werden die Fakultäten verstärkt daran interessiert sein, dass Studierende mit zu erwartendem schwachen Examensergebnis möglichst frühzeitig das Studium abbrechen, oder erst nach dem Überwinden hochgesteckter interner Prüfungsbarrieren – und damit bei verlängerter Studiendauer – in das Staatsexamen eintreten. Diese Überlegungen haben dazu geführt, dass als Erfolgskriterien neben dem Examensergebnis auch die Studiendauer und die Abbrecherquote berücksichtigt werden müssen. Um dabei wiederum dem Aspekt Rechnung zu tragen, dass hier der Wert des Ausbildungsprogramms (Bindung der Studierenden an den Standort) deutlich wird, wäre es wünschenswert, die Erfolgsparameter Examensergebnis und Studiendauer innerhalb einer Referenzgruppe zu bestimmen. Eine solche Gruppe könnte durch Erfassung aller im ersten Semester eingeschriebenen Studierenden (inklusive Nachrücker) gebildet werden. Ausgeschlossen würden bei dieser Zählung die Quereinsteiger und Studienortwechsler.

Die mittlere Studiendauer wird - unter Inkaufnahme extracurricularer Störgrößen - für diejenigen Studierenden ermittelt, die das letzte Studienexamen absolviert haben. Ferner wird für die Referenzgruppe sechs Jahre und 3 Monate nach Studienaufnahme die Anzahl der noch im Ausbildungsprogramm verbliebenen Studierenden namentlich ermittelt (Retentionsquote). Da sich die einzelnen Standorte hinsichtlich der Zulassung unterscheiden, bzw. da Studierende zweimal im Jahr das M2 (neu) ablegen können, müssen die Messgrößen über das Jahr akkumuliert werden. So ergeben sich für die Bemessung die in Tabelle 1 [Tab. 1] angegeben Zahlen, die sich jeweils als akkumulierte Werte über ein Jahr ergeben:

Hinsichtlich der Struktur- und Prozessqualität des Ausbildungsprozesses wurden die folgenden Parameter festgelegt:

1.
Umfang der Mittel, die auf der Basis einer Studentischen Lehrveranstaltungsbewertung (SVK) am Fachbereich (im letzten Haushaltsjahr) verausgabt bzw. umverteilt werden.
2.
Umfang der Mittel, die auf der Basis von Peer Review Lehrprojekten (LP) am Fachbereich (im letzten Haushaltsjahr) verausgabt werden.
3.
Umfang der Stunden, die für hochschuldidaktischen Weiterbildungen des Lehrkörpers am Fachbereich (im letzten Haushaltsjahr) verausgabt werden.
4.
Ausmaß der thematischen Schwerpunktförderung am Fachbereich (im letzten Haushaltsjahr) gemäß eines vorab abgestimmten Themenkanons.

ad 1) Bei der Zuteilung der Mittel, die auf der Basis der Lehrveranstaltungsbewertung erfolgt, ist darauf zu achten, dass Empfänger die Institute oder Kliniken sein sollen.

ad 2) Bezüglich der Lehrprojekte muss nachgewiesen werden, dass es sich um einen Peer-review Prozess handelt. Ferner können die Mittel sowohl Fakultätsmitgliedern, als auch Gruppen von Lehrenden zugeteilt werden.

ad 3) Bezüglich der Stunden, die die Dozenten eines Fachbereiches in Weiterbildungsprogrammen zur Verbesserung der Lehre verbringen, erscheint eine Relation zur Zahl der Dozenten zwingend angebracht, um kleinere Fachbereiche nicht zu benachteiligen.

ad 4) Schließlich soll jährlich ein neuer Schwerpunkt festgelegt werden, der für die Verbesserung der Lehre von besonderer Bedeutung ist. Dies könnte beispielsweise der Aufbau eines Skills Lab, ein Mentorenprogramm, oder ähnliches sein. Die ideale Form der Bewertung und des Vergleichs wäre eine externe Begutachtung anhand eines vorab festzulegenden Kriterienkataloges. Ein vereinfachtes, pragmatisches Vorgehen kann auch hierbei auf der Basis der nachgewiesenen verausgabten (laufenden und aktuell investiven) Mittel erfolgen.

Bei allen auf den verausgabten Mittel basierenden Parametern sollte eine anteilsmäßige Bereinigung im Falle deutlich divergierender Landeszuführungsbeträge erfolgen.

Um basierend auf den einzelnen Teilkriterien einen Gewichtungsfaktor einsetzen zu können, muss die Messskala der einzelnen Kriterien angeglichen werden:

Zieht man von jedem Kriterium den über die 7 Standorte berechneten Mittelwert der beobachteten Kriteriumswerte ab und dividiert den Wert durch die zugehörige Standardabweichung, so resultiert für jedes Kriterium ein einheitenloser Wert (z-Wert). Diese sogenannte z-Transformation gewährleistet zum einen eine Differenzierung die unabhängig vom Ausmaß der Unterschiede erhalten bleibt. Zum anderen werden durch die Angleichung der Messskalen die Parameter erst miteinander verrechenbar und dadurch deren Proportionen anhand der Gewichtungsfaktoren bestimmbar. Die einzelnen Formeln sind in Tabelle 2 [Tab. 2] wiedergegeben.

Es bestand Einvernehmen, dass der maximale denkbare Verlust eines einzelnen Standortes durch die Höhe seines Anteils im Vorwegabzug des Ministeriums für die Leistungsabhängige Mittelvergabe beschränkt ist. Darüber hinaus sollte diese Verlustbegrenzung auch für jeden einzelnen Parameter (entsprechend seines Gewichtungsfaktors) gelten. Dies wurde kalkulatorisch dadurch erreicht, dass für jeden einzelnen Parameter der tatsächlich beobachtete z-Wert auf den im ungünstigsten Falle möglichen minimalen z-Wert (-2,268 bei n = 7) normiert wurde.

Um die Veränderungssensibilität der Parameter darzustellen, wurden im folgenden für sieben fiktive Standorte realitätsnahe Daten einer Modellrechnung unterworfen und im Rahmen einer Gewinn-Verlustrechnung gegenübergestellt (siehe Tabelle 3 [Tab. 3]).

Die Daten wurden bewusst so gewählt, dass die einzelnen Standorte unterschiedliche Lehrprofile im Sinne der Parameterkonstellationen aufweisen. Eine sehr deutliche Differenzierung in der Mittelzuweisung, wie sie sich auch bei alleiniger Verwendung der IMPP-Ergebnisse eines Jahres ergäbe, wird dabei zum Teil nivelliert (vgl. Standort 1 und 2) oder auch - bei sehr schlechten sonstigen Gegebenheiten - umgekehrt (vgl. Standort 6 und 7).

Es wird anhand der Simulation zum einen deutlich, das unterschiedliche Qualitätsprofile zu ähnlichen Resultaten führen können. Dies kann im Sinne einer stärkeren Profilbildung der Standorte als dienlich erachtet werden. Zum anderen ist eine gewisse mit der Erhöhung der Zahl der Parameter natürlicherweise einhergehende Dämpfung der Unterschiede eine Alternative zur Verwendung eines gleitenden Jahresmittels, sowie eines Mittelwertes aus verschiedenen Prüfungsabschnitten (vergleiche Abbildung 1 [Abb. 1]), wie es in der Vergangenheit praktiziert wurde.


Diskussion

Allgemeine Kritik LOM : Es ist bezüglich einer Leistungsabhängigen Mittelvergabe basierend auf einem fixen Budget anzumerken, dass die Idee der Motivationsförderung „Wer sich anstrengt bekommt auch mehr“ natürlich nur möglich ist, wenn das zu verteilende Gesamtbudget variabel ist. Verbessern sich nämlich alle am Prozess beteiligten gleichmäßig, so sollte dennoch jeder einzelne einen Mehrgewinn erzielen, da das Gesamtprodukt sich verbessert hat. Findet hier lediglich eine Umverteilung statt, so erzielt jeder einzelne keinen Mehrgewinn trotz Verbesserung, was nachhaltig demotivierenden Charakter hat. Übrigens führt die gleiche Argumentation dazu, dass wenn alle sich um den gleichen Betrag verschlechtern, die Umverteilung den gleichen Gewinn für alle darstellt. D.h. Zielt man auf eine Leistungssteigerung jedes einzelnen um das Gesamtprodukt „Lehre“ zu verbessern, so müsste eine variable Gesamtmenge leistungsabhängig verteilt werden. Dies ist aber ein Mangel an allen zurzeit betriebenen Systemen der leistungsabhängigen Mittelverteilung.

Ferner gilt einschränkend zu vermerken, dass präexistente Strukturfaktoren und durch die Fakultäten nicht beeinflussbare Standortgegebenheiten einen maßgeblichen Einfluss auf Examensergebnisse ausüben mögen [5], was die gleichzeitige Gerechtigkeit und Handhabbarkeit eines jeden parametrierten Verfahrens wohl letztlich unmöglich macht. Auch insofern setzte auch unser Ansatz zur Konsensfindung eine teils schmerzhafte Kompromissbildung zwischen sachlich wünschenswerten und pragmatisch möglichen Lösungsansätzen voraus.

Kritik Erfolgskriterien: Es ist anzumerken, dass eine einseitige Berücksichtigung der Ergebnisqualität die Gefahr in sich birgt, dass die Qualität eines Ausbildungsprogramms lediglich anhand des erinnerten Fachwissens bewertet wird, wobei komplexes Anwendungswissen und die Entwicklung von ärztlichen Fertigkeiten unberücksichtigt bleiben. Es ist jedoch auch kritisch zu diskutieren, was das Ausbildungsziel eines Medizinstudiums überhaupt sein soll. Besteht das Ziel der Ausbildung eines Studenten lediglich in der Vorbereitung auf den ärztlichen Beruf, so mag die Ausbildung ärztlicher Fertigkeiten im Vordergrund stehen – eine Sichtweise die zur Zeit sicherlich sehr populär ist. Steht im Gegensatz dazu die Ausbildung des wissenschaftlichen Nachwuchses im Vordergrund, so mag strukturiertes komplexes Faktenwissen wichtiger sein. Eine konsensfähige Leistungsabhängige Mittelvergabe sollte diese Aspekte gegebenenfalls auch gewichtet berücksichtigen.

Gegenstand der Erörterung soll an dieser Stelle nicht der Wert oder die Sinnhaftigkeit (vergleiche hierzu: [6], [7]) von zentral organisierten schriftlichen Prüfungen (http://www.impp.de) als – womöglich allein stehendes - Qualitätsmerkmal ärztlicher Ausbildung sein. Vielmehr sollen hier Aspekte vertieft werden, welche die Eignung bestimmter Parameter im Sinne eines Qualitätssicherungszyklus beleuchten sollen. Dieser Ansatz erscheint aufgrund der knapp bemessen Ressourcen, die zusätzlich zum kapazitätsrechtlich fixierten Personalaufwand in die Qualitätspflege der Lehre Eingang finden können, besonders relevant.

Eingangs wurde die erhöhte Variabilität standortbezogener IMPP-Daten illustriert, mit der bei einer Reduktion der zugrunde liegenden Prüfungen schon jetzt zu rechnen ist. Auszugleichen wäre dies Problem durch die Verwendung eines gleitenden Mittelwertes über mehrere Prüfungen und Jahre. Dies wiederum würde zu einer verzögerten Wirksamkeit der Qualitätssicherung führen, da die Daten „gefiltert“ werden. Auch aus einem anderen Grund wäre die Verwendung ausschließlich des Ergebnisses des zweiten Staatsexamens in diesem Sinne abträglich. Ein Verfahren zur Berücksichtigung der Ergebnisse des neuen ersten Staatsexamens (vormals Physikum) für Standorte, an denen es noch durchgeführt wird, wurde ausführlich diskutiert, aber im Hinblick auf Transparenz und Einheitlichkeit nicht weiter verfolgt. Qualitätsverbessernde Maßnahmen im ersten Studienabschnitt etwa, dort vielleicht besonders angebracht [1], wirkten sich mit einer Latenz von mindestens fünf Jahren im Mittelfluss aus, eine sicher nicht motivationsfördernde Perspektive. Das (neue) zweite Staatsexamen kann noch aus weiteren Gründen in seiner Validität als alleiniger Qualitätsindikator medizinischer Fakultäten in Zweifel gezogen werden.

  • Die Ergebnisse werden vermutlich stark vom gerade zurückliegenden Ausbildungsabschnitt, dem Praktischen Jahr, geprägt sein. Freiräume für Theorie-bezogenes Lernen mögen hier zwischen akademischen Lehrkrankenhäusern, und auch zwischen Fakultäten stark differieren. Der praktische Ausbildungsinhalt mag dabei in unzuträglicher, aber nicht erfassbarer Weise kompensatorisch leiden. In jedem Falle ist der curriculare Gestaltungsspielraum der Medizinischen Fakultäten in diesem Ausbildungsabschnitt am geringsten.
  • Dieses Examen ist inhaltlich erst seit kurzem (http://www.impp.de) definiert, ungleich der Vorgängerversion. Solide empirische Daten werden bis auf weiteres fehlen.
  • Die Daten späterer Examina reflektieren eine Mischung von Maßnahmen zur Qualitätsverbesserung mit Selektionsartefakten von Seiten der Studierenden. Ein zunehmender Anteil der Kandidaten hat – im Rahmen von Ortswechseln - nur einen Teil seiner Ausbildung an der jeweiligen Hochschule absolviert. Übereinstimmend sind schon historisch die fakultätsbezogenen Unterschiede deutlich geringer ausgeprägt als etwa im Physikum (siehe Abbildung 1(B) und (D) [Abb. 1]).

Aufgrund seiner großen Zahl von Medizinischen Fakultäten und einem - derzeit zumindest - überproportional hohen Anteil von Modellstudiengängen eignet sich das Land Nordrhein-Westfalen in besonderer Weise, sich diesem grundsätzlich bundesweit relevanten Problem zu stellen. Die Zieldefinition, die neben den vom Ministerium gewünschten Kriterien auch eine Folgenlastigkeit im Sinne einer generellen Verbesserung der Ausbildungsqualität beinhalten sollte, ließ sich rasch und problemlos vornehmen. Der Konsentierungsprozess gestaltete sich zeitraubender in der Frage der einzuschließenden, die Qualität valide anzeigenden Parameter. Die Diskussion um Standort-Spezifika, wie etwa unterschiedlich ausgeprägte Alleinstellungsmerkmale der Universitätsklinika in der jeweiligen Versorgungslandschaft, unterschiedliche Lebenshaltungskosten im Studium mit entsprechendem Bedarf an Nebenverdiensten, oder auch die standortspezifischen Bewerberprofile konnte letztlich nicht gelöst sondern lediglich als Merkpunkt an das Ministerium rückverwiesen werden. Die Arbeitsgruppe sah sich außerstande, derartige Faktoren qualitätswirksam und gerecht zu parametrieren. Gleichfalls intensiv gestaltete sich eine wiederkehrende Diskussion über so genannte „harte“ und „weiche“ Parameter, wobei erstere bisweilen mit Studiengangs-bezogenen Daten bedeutungsmäßig gleichgesetzt wurden. Klärung schaffte in diesem Punkt, anstelle dessen eine Differenzierung in „Ergebnisqualitäts"- bezogene und „Struktur"- bzw. „Prozessqualitäts"- bezogene Parameter vorzunehmen. Die Bezugnahme auf belastbare und valide (=“harte“) Daten wurde in jedem Falle vorausgesetzt und eingehend geprüft. Hilfreich in diesem Zusammenhang war der Rückgriff auf das für Baden-Württemberg empfohlene Modell, welches eine ausgewogene Berücksichtigung der - letztlich entscheidenden – Ergebnisqualität mit der zeitnah (im Jahresturnus) im Sinne des Qualitätsmanagements wirksamen Struktur- und Prozessqualität bereits angedacht hatte [2].

Bei näherer Betrachtung der Studiengangs-bezogenen Daten wurde ersichtlich, dass die Berücksichtigung von mittleren Examensnoten und Studiendauern der Absolventen zwar wichtig, aber in der Folgenabschätzung hochgradig anfällig wäre gegenüber curricularen Maßnahmen, die

  • memorierbares Faktenwissen gegenüber komplexerem Anwendungswissen und der Entwicklung ärztlicher Fertigkeiten,
  • kurze Studiendauern durch geringe Leistungsansprüche gegenüber notwendigen Unterstützungsangeboten für leistungsschwächere Studierende,
  • die Selektion leistungsstärkerer Studierender z.B. durch Wiederholungsbegrenzungen von Einzelprüfungen

begünstigen würden. Zudem sind diese Daten kontaminiert durch Absolventen, die ihren wesentlichen Kenntniserwerb an anderen Fakultäten vollzogen hatten. Dies gilt in einem umso höheren Maße, je ausgiebiger und je später im Studienverlauf von selektierenden Maßnahmen Gebrauch gemacht würde. Schließlich ist die Auffüllung freiwerdender Studienplätze zumindest an attraktiven Standorten regelhaft zu beobachten und kapazitätsrechtlich unabwendbar. Daher wurde die Bezugnahme dieser Daten auf eine Referenzgruppe, deren Leistungen am ehesten das Leistungsvermögen der jeweiligen Fakultät dargestellt, vorgeschlagen. Optimal gelänge dies durch Erhebung von Daten ausweislich derjenigen Absolventen, die ihr gesamtes (klinisches) Studium an der jeweiligen Hochschule verbracht haben. Näherungsweise sollte es aber auch gelingen, durch die Einführung des leicht zu erhebenden Parameters „Retentionsquote“ die oben genannten Fehlsteuerungen zu vermeiden. Dass dabei diese „Ortsfestigkeit“ der Studierenden nicht als direkter Qualitätsindikator, sondern lediglich als Korrekturglied im Kontext Studiengangs-bezogener Daten verstanden werden darf, stellte sich im Lauf intensiver Diskussionen klar heraus. Offen blieb die Frage, ob sich die Retentionsquote auf das gesamte Studium oder lediglich den klinischen Studienabschnitt beziehen sollte. Alternativ müsste für Hochschulen mit Teilstudienplätzen eine gesonderte Prozedur erarbeitet werden. Letztlich wurde - nicht zuletzt in Würdigung der ministeriellen Vorgaben - einfache Erhebung, Vergleichbarkeit, Meßbarkeit, Transparenz - dem Faktor Staatsexamen mit 0,3 die mit Abstand höchste Gewichtung verliehen. Hierfür war mit ausschlaggebend, dass zumindest ähnliche Daten seit vielen Jahren vorliegen und eine gewisse Vorhersehbarkeit in der Steuerungswirkung erwarten lassen. Zudem behielte das letzte schriftliche Staatsexamen auf diese Weise in der Gesamtbetrachtung das etwa gleiche Gewicht gegenüber der bisherigen Situation. Dass hierbei auch numerisch kleine Unterschiede im Zuge der z-Transformation gewichtig zum Tragen kommen, entspricht dem ebenfalls historischen Sachstand.

Über den Sinn Prozess- und Struktur-bezogener Daten bestand sowohl aufgrund der Zielsetzung „Qualitätsförderung der Lehre“ als auch angesichts der Möglichkeit rascher Steuerungseffekte schnell Einigkeit. Problematischer gestaltete sich die Parametrierung im Sinne belastbarer Zahlen bei vertretbarem Erhebungsaufwand. Einige Bereiche – auch schon im Baden-Württembergischen Konzept [2] expliziert – erwiesen sich dabei als machbar und bei entsprechender Gewichtung auch hinreichend repräsentativ für die Gesamtbemühungen (zeitlich und monetär) einer Fakultät in Hinblick auf die Qualität der Lehre. Diese wurden unmittelbar in den Parametersatz aufgenommen. Andere Bereiche, so z.B. strukturelle Vorhaltungen zur Verbesserung der berufspraktischen Fertigkeiten (Skills lab), Ausmaß und Qualität der Internationalisierung, Einführung weiterführender Studiengänge, Bibliotheks-, PC-, Multimedia-Angebote, Mentorenprogramme, Institutionalisierung der Lehrforschung etc.) erschienen ohne weiteres nicht parametrierbar und bedürften vermutlich einer gezielten, vergleichenden Begutachtung aus externer Sicht. Als konsensfähiger Kompromiss zwischen Machbarkeit und Themenfülle erwies der Vorschlag, jedes Jahr lediglich einen dieser Bereiche im Ausschreibungswege zum Gegenstand eines (geringen) Teiles der Mittelzuweisung auszuwählen und die hierzu nachgewiesenen Kosten des Haushaltsjahres – alternativ das Ergebnis einer fokussierten externen Begutachtung – zugrunde zu legen.

Die Gewichtung der ausgewählten Parameter mit einem Übergewicht der Ergebnisqualitäts-bezogenen Daten erwies sich als nicht kontrovers. Eine Folgenabschätzung konnte mittels einer Modellrechnung auf Basis fiktiver aber realitätsnaher Daten vorgenommen werden. Diese zeigte vergleichbare Relationen wie das bis dato angewandte, auf vollständigen Examensdaten basierte Verfahren. Nicht in den Entscheidungsbereich der Arbeitsgruppe fiel die Frage nach dem absoluten Ausmaß der (um-)zu verteilenden Mittel und der Implementierungsgeschwindigkeit des neuen Verfahrens. In der Folgenabschätzung sieht die Arbeitsgruppe ihre eigene Aufgabe vielmehr darin, durch Adjustierung der Gewichtungsfaktoren bzw. durch Ergänzung mit weiteren Parametern Fehlsteuerungen abzuwenden, sobald sie aus interner oder externer Sicht erkennbar werden. Auch aus diesem Grund scheint eine externe Begutachtung – zumindest in bescheidenem Umfange – im Jahresturnus lohnenswert. Wir sind der Auffassung, daß das hier vorgestellte Modell auch über die Grenzen Nordrhein-Westfalens hinweg in Betracht gezogen werden kann, und in seinen Grundzügen auch für andere Studiengänge als Diskussionsgrundlage in Betracht kommt.

Interne [8], [9], [10] und hochschulübergreifende [11] Mittelvergabesysteme sind auch in Deutschland vielerorts schon seit mehreren Jahren etabliert. Publizierte Erfahrungen mit den Auswirkungen von Leistungsanreizsystemen der beschriebenen Art in der medizinischen Lehre konnten wir nicht finden. Auch die internationale Literatur beschränkt sich bei vergleichenden quantitativen Analysen auf die Wirksamkeit gezielter zusätzlicher Finanzierungen [12], [13], (Übersicht bei [14]). Der Einfluss lediglich eines wettbewerbsfördernden Umverteilungsverfahrens bei gegebenen Gesamtressourcen, analog zur Forschungsförderung, bedarf der frühzeitigen evaluativen Begleitung. Eine wissenschaftliche Erfassung des Gesamteffektes, im Sinne evidenz-basierter Lehre [15] sollte letztlich über die konkrete Ausgestaltung und den Umfang solcher Leistungs-orientierter Verfahren bestimmen.


Literatur

1.
Bundesministerium für Gesundheit und Soziale Sicherung. Gutachten zum "Ausstieg aus der kurativen ärztlichen Berufstätigkeit in Deutschland". Abschlussbericht. Hamburg: Eigenverlag Rambøll Management; 2004.
2.
Ministerium für Wissenschaft, Forschung und Kunst Baden-Württemberg. Medizinische Ausbildung in Baden-Württemberg. Bericht der Sachverständigenkommission zur Bewertung der Medizinischen Ausbildung (BeMA). Stuttgart: Schwäbische Druckerei GmbH; 2001.
3.
World Federation for Medical Education. Basic Medical Education. Copenhagen: WFME Global Standards for Quality Improvement; 2003.
4.
Wissenschaftsrat. Empfehlungen des Wissenschaftsrates zur Stärkung der Lehre in den Hochschulen durch Evaluation. Berlin: Eigenverlag. 1996:Drs. 2365/96.
5.
van den Bussche H, Wegscheider K, Zimmermann T. Medizinische Fakultäten: Der Ausbildungserfolg im Vergleich (II). Dtsch Arztebl. 2006;103:A-2225-8.
6.
Clade H. Reform des Medizinstudiums. Die Medizinischen Fakultäten machen jetzt Druck. Dtsch Arztebl. 2002;99:A3150-2.
7.
Daig U, Herrmann I. Das Kreuzen mit den Kreuzen. Dtsch Arztebl. 2002;99:A1643-4.
8.
Berger U, Schleußner C, Strauß B. Umfassende Lehrevaluation in der Medizin - eine Aufgabe für die psychosozialen Fächer? Psychother Psychosom Med Psychol. 2003;53(2):71-78.
9.
Hövelmann R, Korf HW, Kersken-Nuelens U, Nürnberger F. Multifaktorielle Lehrevaluation am Beispiel der Johann Wolfgang Goethe-Universität. Med Ausb. 2000;17:128.
10.
Stifterverband für die Deutsche Wissenschaft. Quo vadis medice? Neue Wege in der Medizinerausbildung in Deutschland, Österreich und der Schweiz. Dortmund: Gestaltmanufaktur GmbH; 2004.
11.
Wissenschaftsrat. Standortübergreifende Stellungnahme zur Weiterentwicklung der Universitätsmedizin in Baden-Württemberg. Berlin: Eigenverlag. 2004:Drs. 6196-04.
12.
Bland CJ, Starnaman S, Harris D, Henry R, Hembroff L. "No fear" curricular change: monitoring curricular change in the W. K. Kellogg Foundation's National Initiative on Community Partnerships and Health Professions Education. Acad Med. 2000;75(6):623-633.
13.
Veloski JJ, Barzansky B. Evaluation of the UME-21 initiative at 18 medical schools between 1999 and 2001. Fam Med. 2004;36(Suppl):138-145.
14.
Bland CJ, Starnaman S, Wersal L, Moorehead-Rosenberg L, Zonia S, Henry R. Curricular change in medical schools: how to succeed. Acad Med. 2000;75(6):575-594.
15.
Dauphinee WD, Wood-Dauphinee S.The need for evidence in medical education: the development of best evidence medical education as an opportunity to inform, guide, and sustain medical education research. Acad Med. 2004;79(10):925-930.