gms | German Medical Science

GMS Zeitschrift für Medizinische Ausbildung

Gesellschaft für Medizinische Ausbildung (GMA)

ISSN 1860-3572

Eignung von HAM-Nat und TMS-Modul "Medizinisch-naturwissenschaftliches Grundverständnis" für die Studienbewerberauswahl in der Medizin

Forschungsarbeit Humanmedizin

Suche in Medline nach

  • author Johanna Hissbach - Universitätsklinikum Hamburg Eppendorf (UKE), Institut für Biochemie und Molekulare Zellbilogie, Hamburg, Deutschland
  • author Lena Feddersen - Universitätsklinikum Hamburg Eppendorf (UKE), Institut für Biochemie und Molekulare Zellbilogie, Hamburg, Deutschland
  • author Susanne Sehner - Universitätsklinikum Hamburg Eppendorf (UKE), Institut für Biochemie und Molekulare Zellbilogie, Hamburg, Deutschland; Universitätsklinikum Hamburg Eppendorf (UKE), Institut für medizinische Biometrie und Epidemiologie, Hamburg, Deutschland
  • corresponding author Wolfgang Hampe - Universitätsklinikum Hamburg Eppendorf (UKE), Institut für Biochemie und Molekulare Zellbilogie, Hamburg, Deutschland

GMS Z Med Ausbild 2012;29(5):Doc72

doi: 10.3205/zma000842, urn:nbn:de:0183-zma0008422

Dieses ist die Originalversion des Artikels.
Die übersetzte Version finden Sie unter: http://www.egms.de/en/journals/zma/2012-29/zma000842.shtml

Eingereicht: 30. November 2011
Überarbeitet: 20. Juni 2012
Angenommen: 21. Juni 2012
Veröffentlicht: 15. November 2012

© 2012 Hissbach et al.
Dieser Artikel ist ein Open Access-Artikel und steht unter den Creative Commons Lizenzbedingungen (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.de). Er darf vervielfältigt, verbreitet und öffentlich zugänglich gemacht werden, vorausgesetzt dass Autor und Quelle genannt werden.


Zusammenfassung

Ziele: Tests mit naturwissenschaftlichen Inhalten sind prädiktiv für den Studienerfolg in den ersten Semestern des Medizinstudiums. Einige deutschsprachige Universitäten verwenden für die Studienbewerberauswahl den Test für Medizinische Studiengänge (TMS), dessen Test-Modul „Medizinisch-naturwissenschaftliches Grundverständnis“ die Fähigkeit zu schlussfolgerndem Denkens erfasst. Im Hamburger Auswahlverfahren für Medizinische Studiengänge - Naturwissenschaftsteil (HAM-Nat) werden dagegen naturwissenschaftliche Kenntnisse überprüft. In dieser Studie vergleichen wir die prädiktive Stärke des HAM-Nat mit einem Test (NatDenk), der dem TMS-Modul „Medizinisch-naturwissenschaftliches Grundverständnis“ inhaltlich und strukturell ähnelt.

Methoden: Im Jahr 2007 nahmen 162 Studienanfänger der Humanmedizin freiwillig am HAM-Nat (N=77) oder am NatDenk (N=85) teil. Bis zum Frühjahr 2011 hatten 84,2% der Testteilnehmer das Physikum in Hamburg bestanden. Mittels verschiedener logistischer Regressionsmodelle überprüften wir die Vorhersagekraft der Abiturnote und der Testergebnisse (HAM-Nat und NatDenk) auf das Studienerfolgskriterium „Physikum nach 7 Studiensemestern bestanden“. Berichtet werden die Odds Ratios (OR) für Studienerfolg.

Ergebnisse: Für beide Testgruppen bestand ein signifikanter Zusammenhang zwischen Testergebnis und Studienerfolg (HAM-Nat: OR=2,07; NatDenk: OR=2,58). Werden beide Zulassungskriterien in einem Modell geschätzt, sind in der HAM-Nat Gruppe beide Haupteffekte (Abitur: OR=2,45; Test: OR=2,32) und deren Interaktionseffekt (OR=1,80) signifikant, während in der NatDenk Gruppe nur das Testergebnis (OR=2,21) allein einen signifikanten Beitrag zur Aufklärung der Varianz liefert.

Schlussfolgerungen: Für sich genommen haben sowohl HAM-Nat als auch NatDenk prädiktive Information für den Studienerfolg, allerdings klärt die Abiturnote nur bei Verwendung des HAM-Nat zusätzliche Varianz auf. Die Auswahl nach HAM-Nat und Abiturnote hat unter den aktuellen Bedingungen des Medizinerauswahlverfahrens mit vielen guten Bewerbern aber nur wenigen Studienplätzen die höchste Vorhersagekraft aller Modelle.

Schlüsselwörter: HAM-Nat, Studienbewerberauswahl, Medizin, Naturwissenschaftstest, TMS


Autorenschaft

Johanna Hissbach und Lena Feddersen trugen in gleichen Teilen zu dieser Arbeit bei und teilen sich die Erstautorschaft.


Einleitung

Studienbewerber für das Fach Medizin sind in Deutschland mit vielen unterschiedlichen Zulassungsmodalitäten konfrontiert [1]. Während die Abiturnote als maßgebliches Auswahlkriterium gesetzlich vorgeschrieben ist [2], können weitere, hochschulspezifische Kriterien wie Tests, Interviews oder Boni für bestimmte Leistungen in die Auswahlentscheidung mit einbezogen werden. Der wohl bekannteste deutsche Studieneingangstest ist der „Test für Medizinische Studiengänge“ (TMS) [3]. Nachdem der TMS in Deutschland nach 1996 nicht mehr eingesetzt wurde, begannen im Jahr 2007 die baden-württembergischen Universitäten damit, gute Testergebnisse bei der Zulassung zu berücksichtigen. Im Wintersemester 2011/12 vergaben 10 von 34 medizinischen Fakultäten Bonuspunkte für gute TMS-Leistungen.

Seit 2008 wird am Universitätsklinikum Eppendorf das Hamburger Auswahlverfahren für medizinische Studiengänge, Naturwissenschaftsteil (HAM-Nat) zur Studienbewerberauswahl eingesetzt. Beide Tests, der HAM-Nat und der TMS, wurden eigens für die Auswahl von Medizinstudierenden entwickelt, zielen jedoch auf unterschiedliche Konstrukte ab. Der HAM-Nat zielt darauf ab, auf Oberstufenniveau naturwissenschaftliche Kenntnisse und Fähigkeiten, die für das Medizinstudium relevant sind, zu überprüfen. Der TMS enthält mit dem Testmodul „medizinisch-naturwissenschaftliches Grundverständnis“ zwar auch naturwissenschaftliche Fragen, diese sollen aber „verbal-schlußfolgerndes, deduktives Denken in fachbezogenen Kontexten“ abbilden, es ist kein spezielles Fachwissen erforderlich [4]. Dieses Modul ist eine von vier medizinnahen Aufgabengruppen, auf denen die Vorhersagekraft des TMS im Wesentlichen beruht [3]. Im Gegensatz zum HAM-Nat, bei dem die Vorbereitung motivierter Bewerber dazu führt, dass für die ersten Semester relevante schulische Themen vor Studienbeginn wiederholt werden, hat die Vorbereitung auf den TMS keinen inhaltlichen Bezug zum Studium und soll nach Aussage der Testentwickler zudem nur zu einer geringfügigen Ergebnisverbesserung führen [3].

Der HAM-Nat wurde mit dem Ziel entwickelt, die Abbrecherquote im 1. Studienabschnitt zu reduzieren. Da die Abiturdurchschnittsnote mit einer korrigierten prädiktiven Stärke von r=0,58 [5] für Studiennoten im vorklinischen Studienabschnitt ein solider Prädiktor für Studienerfolg (Physikumsnote) ist, stellt sich die Frage, was wir gewinnen, wenn wir weitere Tests zur Studierendenauswahl einsetzen.

Sowohl das HAM-Nat Testergebnis als auch die Abiturnote waren in der 2006er Kohorte signifikante Prädiktoren für Studienerfolg nach dem 2. Semester, operationalisiert als Anzahl der bestandenen Prüfungen (r=0,31 bzw. r=0,26), und klärten gemeinsam 13% der Gesamtvarianz auf [6]. Der Beitrag zur erklärten Varianz war für den HAM-Nat allein (9,5%) höher als für die Abiturnote allein (6,6%). Betrachtet man eine Substichprobe, die der Hochschulquote entspricht, ist die Varianz der Abiturnote derart eingeschränkt, dass keine signifikante Korrelation mit dem HAM-Nat zu finden ist (r=0,11) [6]. Unterschiede im Bereich der sehr guten Abiturnoten (1,2 – 1,7) haben also keinen wesentlichen Einfluss auf das HAM-Nat Ergebnis. Die Varianzeinschränkung der Abiturnote in der Gruppe der Hochschulquote führt auch dazu, dass sie – im Gegensatz zum HAM-Nat Ergebnis – nicht mehr signifikant mit dem Kriterium Studienerfolg korreliert. Für den HAM-Nat sinkt die prädiktive Stärke hingegen nur leicht von r=0,31 auf r=0,26.

Die Ergebnisse unterschiedlicher HAM-Nat Testversionen aus den Vorstudien mit Studienanfängern 2006 und 2007 korrelieren mit der Abiturdurchschnittsnote in der Stichprobe aller Studienanfänger zwischen r=0,12 und r=0,34 [6], [7], der TMS-Subtest „medizinisch-naturwissenschaftliches Grundverständnis“ gehört zu einer Gruppe von TMS-Modulen, die mit der Abiturnote zwischen r=0,28 und r=0,40 korrelieren (3). Die Korrelationen des gesamten TMS mit der Abiturnote sind mit r=0,36 bis r=0,48 höher. Dennoch schlussfolgern die TMS-Autoren, dass Schul- und Testleistung größtenteils unterschiedliche Leistungsaspekte erfassen [3], [4]. Im TMS-Modul „medizinisch-naturwissenschaftliches Grundverständnis“ wird die Fähigkeit erfasst, „aus Geschriebenem rasch das Essentielle zu extrahieren und die richtigen Schlüsse daraus zu ziehen“ (S. 53 in [3]). Untersuchungen zeigten, dass hierfür eine interne Repräsentation der Textinformationen im Arbeitsgedächtnis, die Konstruktion einer Interferenzkette, und eine Umkodierung von Textaussagen in ein Vorstellungsbild wichtig sind [3].

Im Rahmen einer zweiten Studie vor der Einführung des HAM-Nat in das Hamburger Auswahlverfahren wurde der Zusammenhang des HAM-Nat mit dem Testmodul „Naturwissenschaftliches Denken“ (NatDenk) untersucht. Dieses Modul ähnelt strukturell und inhaltlich dem Subtest „Medizinisch-naturwissenschaftliches Grundverständnis“ des TMS. Für den HAM-Nat betrug die Korrelation mit dem NatDenk je nach Testversion r=0,34 oder r=0,21 [7], beide Tests bilden also unterschiedliche Konstrukte ab.

In Deutschland, Österreich und der Schweiz werden von unterschiedlichen Fakultäten sowohl Kenntnis- und Fähigkeitstests mit naturwissenschaftlichen Inhalten wie der HAM-Nat als auch Studierfähigkeitstests wie der TMS von medizinischen Fakultäten zur Studierendenauswahl eingesetzt. Ziel ist jeweils die Optimierung des Studienerfolgs. In der hier beschriebenen Untersuchung vergleichen wir die prädiktive Stärke der beiden Tests bezüglich des Studienerfolgs. Als Studienerfolgsparameter wählten wir das Bestehen des Physikums innerhalb der ersten sieben Semester, da die bis zu diesem Zeitpunkt erfolglosen Studierenden in der Regel das Studium an der Universität Hamburg nicht abschließen. Als zweites Kriterium untersuchten wir „Physikum nach dem 4. Semester bestanden“, da viele Universitäten einen Abschluss in Regelstudienzeit anstreben.


Methoden

HAM-Nat

Die 2007er Version des HAM-Nat umfasst 60 Multiple-Choice Fragen aus dem Bereich Mathematik, Chemie, Physik und Biologie. Die Inhalte stammen aus medizinrelevanten Themengebieten auf dem Niveau der gymnasialen Oberstufe. Auf der Internetseite des Universitätsklinikums Eppendorf (UKE) sind der aktuelle Themenkatalog und ein Selbsttest mit Fragen der 2006 und 2007er Testversionen zu finden (http://www.uke.de/studienbewerber). Eine von fünf Antwortalternativen ist jeweils richtig und die Teilnehmer hatten pro Frage 1,5 Minuten Zeit zur Bearbeitung. Entwickelt wurden die Fragen von Gymnasiallehrern sowie von Dozenten der klinischen und theoretischen Fächer der medizinischen Fakultät.

Testmodul „Naturwissenschaftliches Denken“

Für den Vergleich des HAM-Nat mit dem TMS-Modul „medizinisch-naturwissenschaftliches Grundverständnis“ als externem Kriterium entwickelte die ITB-Consulting GmbH, die auch den TMS erstellt, ein inhaltlich und strukturell dem TMS-Modul entsprechendes Testmodul (NatDenk) mit 24 Multiple-Choice Aufgaben. Jede Aufgabe ist so aufgebaut, dass eine von fünf aufgestellten Behauptungen zu einem zuvor dargestellten naturwissenschaftlichen Sachverhalt passt. Für die 24 Aufgaben haben die Testteilnehmer 55 Minuten Zeit. Die Aufgaben setzen kein spezifisch naturwissenschaftliches Wissen voraus, sondern sollen die Durchdringung eines Sachverhalts und die Fähigkeit zu schlussfolgerndem Denken abbilden. Das Recht, das Testmodul durchzuführen, wurde von ITB-Consulting erworben.

Studienerfolg

Studienerfolg wurde operationalisiert als „Physikum bis nach dem 7. Semester in Hamburg bestanden“ (Erfolg7Sem). Wir wählten dieses dichotome Kriterium als Hauptkriterium, da das primäre Ziel bei der Entwicklung des HAM-Nat war, die Zahl der Studienabbrecher im vorklinischen Studienabschnitt zu verringern. Die Wahrscheinlichkeit, das Physikum noch zu bestehen, sinkt mit zunehmender Anzahl von Fachsemestern. Um die Stabilität der Modelle zu überprüfen, berechneten wir noch den Zusammenhang mit einem weiteren dichotomen Studienerfolgskriterium: Bestehen des Physikums in Regelstudienzeit nach 4 Semestern (Erfolg4Sem). Dieses Kriterium wird insbesondere dann verwendet, wenn der Fokus auf monetären Aspekten liegt, da durch plangemäße Studienverläufe Kosten eingespart werden können. Für eine übersichtliche Darstellung diskutieren wir die Ergebnisse für das Kriterium Erfolg4Sem nur, wenn sie sich von unserem Hauptkriterium Erfolg7Sem unterscheiden.

Studiendesign

Die Untersuchung fand im Jahr 2007 im Rahmen einer breiter angelegten Studie zur Parallel- und Retestreliabilität des HAM-Nat statt [7]. In der Orientierungseinheit wurde den Studienanfängern der Humanmedizin die Teilnahme an dieser Studie angeboten. Vier Wochen nach Semesterbeginn wurden die Teilnehmer randomisiert in zwei Gruppen aufgeteilt: eine Gruppe bearbeitete den HAM-Nat, die andere das Testmodul „Naturwissenschaftliches Denken“. Die Studienteilnahme war freiwillig und die Durchführung des Tests im Anschluss an eine Pflichtlehrveranstaltung wurde durch Mitarbeiter unserer Arbeitsgruppe organisiert und von Dozenten der Medizinischen Fakultät beaufsichtigt. Der Test „Naturwissenschaftliches Denken“ wurde eigens für diese Studie durchgeführt. Im Mai 2011 wurden die Testergebnisse mit den Studienerfolgsergebnissen zusammengeführt.

Stichprobe

Die Studie wurde mit Studienanfängern der Kohorte 2007 durchgeführt. Diese waren nach ihrer Abiturdurchschnittsnote ausgewählt worden oder über die anderen Quoten (Wartezeit, Ausländerquote) zugelassen worden. Der Numerus clausus lag in diesem Jahr in Hamburg bei 1,6. Berücksichtigt wurden für diese Auswertung nur die Daten derjenigen Studienteilnehmer, denen eine Abiturnote zugeordnet werden konnte. Die Gesamtstichprobe, auf deren Basis diese Analyse erfolgte, umfasste 162 Studienanfänger. Diese Stichprobe unterscheidet sich in Hinsicht auf Geschlecht, Alter und Abiturnote nicht signifikant von der Gesamtheit der Studienanfänger in der Orientierungseinheit. Die eine Hälfte der Testteilnehmer (N=77) bearbeiteten die 2007er HAM-Nat Testversion und die andere Hälfte (N=85) eine Woche später das Modul „Naturwissenschaftliches Denken“ (NatDenk). Alle Studienteilnehmer willigten schriftlich in die Verwendung ihrer Daten ein.

Statistische Analyse

Um die Testergebnisse und die Abiturnoten auf einer gemeinsamen Skala abbilden zu können, wurden sie z-transformiert. Mit Hilfe eines logistischen Regressionsmodells überprüften wir in drei verschiedenen Modellen die Vorhersagekraft der Abiturnote sowie der Testergebnisse (HAM-Nat und NatDenk) auf die Studienerfolgskriterien Erfolg7Sem und Erfolg4Sem. Innersubjektfaktoren waren jeweils die Abiturnote und das Testergebnis, Zwischensubjektfaktoren die Testgruppenzugehörigkeit (HAM-Nat vs. NatDenk). Wir berichten die Odds Ratios und 95%-Konfidenzintervalle. IBM SPSS Statistics, Version 19.0.0 wurde für die Analysen verwendet.


Ergebnisse

Stichprobe

Von allen Studienteilnehmern haben in Hamburg 67,3% das Physikum in Regelstudienzeit und 84,6% bis zum Frühjahr 2011, also in 7 Semestern, bestanden. Einen Überblick über die Charakteristika der Gesamtstichprobe und der beiden Substichproben liefert Tabelle 1 [Tab. 1].

Signifikante Korrelationen mit der Abiturnote gab es für die Physikumsgesamtnote (r=0,24; p=0,004) und den HAM-Nat (r=-0,24; p=0,038), nicht aber für den NatDenk (r=-0,11; p=0,324). Die negativen Korrelationswerte bedeuten, dass gute (niedrige) Abiturnoten mit guten (hohen) Testergebnissen zusammenhängen.

Prädiktion

Die Auswertung der Ergebnisse erfolgte in mehreren Schritten. Wir haben getrennt für die Abiturnote und die Testergebnisse untersucht, inwieweit sie mit dem Studienerfolg zusammenhängen und schließlich in einem Gesamtmodell ergänzend die Interaktion zwischen beiden Kriterien mit eingeschlossen.

Modell 1: Abiturnote

In der Gesamtstichprobe bestand ein signifikanter Zusammenhang zwischen der Abiturnote und dem Studienerfolg (Odds Ratio: OR=1,72; p=0,006 für Erfolg7Sem und OR=1,98; p=0,000 für Erfolg4Sem). Das OR von 1,72 bedeutet, dass die Chance, das Physikum nach 7 Semestern bestanden zu haben, mit jeder Verbesserung in der Abiturnote um eine Standardabweichung (ca. 0,6 Notenpunkte) um das 1,72-fache steigt.

Getrennt nach der Testgruppe zeigt sich ein Effekt der Abiturnote auf den Erfolg7Sem, der für die HAM-Nat Gruppe signifikant ist und für die NatDenk Gruppe knapp über der Signifikanzschwelle von p=0,05 liegt (siehe Tabelle 2 [Tab. 2]). Abbildung 1 [Abb. 1] veranschaulicht diesen Effekt: Die unabhängige Variable Abiturnote wurde am Median dichotomisiert in gut (Abi≤1,6) vs. schlecht (Abi≥1,6) und die geschätzten Wahrscheinlichkeiten in Abhängigkeit für den Studienerfolg getrennt für die beiden Gruppen aufgetragen. Für das Kriterium Erfolg4Sem bestand in beiden Gruppen ein signifikanter Zusammenhang zwischen Abiturnote und Studienerfolg (siehe Tabelle 2 [Tab. 2]).

Modell 2: Testergebnis (HAM-Nat vs. NatDenk)

Jeweils für die Tests allein, also ohne den Einfluss der Abiturnote, besteht ein signifikanter Zusammenhang zwischen Testergebnis und Studienerfolg (siehe Tabelle 2 [Tab. 2]). Während sich die Wahrscheinlichkeit, das Physikum zu bestehen, pro Standardabweichung nach oben im HAM-Nat in etwa verdoppelt, steigt sie beim NatDenk etwas stärker um den Faktor 2,58. Die beiden ORs unterscheiden sich nicht signifikant (p=0,909).

Modell 3: Abiturnote und Testergebnis (HAM-Nat vs. NatDenk) mit Interaktion

Werden die Effekte beider Zulassungskriterien sowie deren Wechselwirkung in einem Modell geschätzt, sind in der HAM-Nat Gruppe beide Haupteffekte und die Wechselwirkung signifikant, während in der NatDenk Gruppe nur das Testergebnis allein einen signifikanten Beitrag zur Aufklärung der Varianz liefert (siehe Tabelle 2 [Tab. 2]). Das bedeutet, dass beim HAM-Nat die prädiktive Stärke des Testergebnisses von der Abiturnote des Getesteten abhängt. Vor allem bei guten Abiturnoten enthält der HAM-Nat zusätzliche Informationen für den Studienerfolg (siehe Abbildung 1 [Abb. 1]), während die Abiturnote zusätzlich zum NatDenk keine weitere Information liefert.

Für das Kriterium Erfolg4Sem ist die Interaktion zwischen HAM-Nat und Abiturnote nicht signifikant und die Abiturnote verliert wenig prädiktive Stärke. In der NatDenk Gruppe tragen nun zwar beide Prädiktoren signifikant zur Vorhersage des Studienerfolgs bei, allerdings ist der Einfluss der Abiturnote größer als der des Testergebnisses.

Sensitivität und Spezifität

Die Receiver Operating Characteristic (ROC) zeigt den Zusammenhang zwischen Sensitivität und Spezifität eines Tests (siehe Abbildung 2 [Abb. 2]). Mithilfe der ROC-Kurven kann man verdeutlichen, was passieren würde, wenn man verschiedene Selektionsquoten bei der Studierendenauswahl anwendet.

Eine hohe Sensitivität bedeutet in unserem Fall, dass wir möglichst wenige Bewerber ablehnen, die erfolgreich studieren können. Die höchste Sensitivität könnten wir erreichen, indem wir alle Bewerber zulassen, was einer Selektionsquote von 100% entspricht (also keine Selektion, rechts auf der x-Achse in Abbildung 2 [Abb. 2]). Dann hätten alle, die das Physikum in diesem Zeitraum schaffen, auch eine Chance bekommen, und wir hätten niemanden fälschlicherweise abgelehnt. Allerdings hätten wir so auch all diejenigen zugelassen, die das Physikum nicht schaffen (geringe Spezifität, ebenfalls rechts auf der x-Achse).

Ist unser Ziel in erster Linie, die Studienabbrecher zu identifizieren, brauchen wir einen spezifischen Test. Legen wir eine strengere Selektionsquote zugrunde, bewegen uns also weiter nach links auf der x-Achse, sinkt unsere Sensitivität bei steigender Spezifität. Durch eine strengere Auswahl können wir demnach mit einer höheren Treffsicherheit diejenigen identifizieren, die das Physikum nicht schaffen, lehnen allerdings auch viele Studienbewerber ab, die erfolgreich gewesen wären.

Ein Maß für die Güte eines Tests ist die „area under the curve“ (AUC). Sie zeigt an, inwieweit ein Test in der Lage ist, zwei Gruppen (in unserem Fall „erfolgreich“ vs. „nicht erfolgreich“) voneinander zu trennen. Die AUCs für die verschiedenen Modelle und die beiden Tests sind in Tabelle 3 [Tab. 3] dargestellt. In beiden Testgruppen unterscheidet sich die AUC für die Abiturnote allein (Modell 1) nicht signifikant von 0,5, was einer Zufallsauswahl entsprechen würde. Sowohl für den Test allein, als auch für den Test und die Abiturnote plus deren Interaktion unterscheiden sich die Kurven signifikant von 0,5.

Aus Abbildung 2 [Abb. 2] wird deutlich, dass durch den HAM-Nat gerade bei einer hohen Selektionsquote, d.h. bei hoher Spezifität (links auf der x-Achse), mehr erfolgreiche Studenten ausgewählt werden würden als durch die Abiturnote allein (Modell 3 vs. Modell 1). Beim NatDenk zeigt sich gegenüber der Abiturnote eine höhere Sensitivität im Bereich geringerer Spezifität. Dieser Bereich steht für ein Auswahlverfahren mit vielen Studienplätzen und wenigen Bewerbern.

In der Gesamtstichprobe hatten 84,6% das Physikum bis 2011 bestanden. Für das Kriterium Erfolg4Sem lag die Quote bei 67,3%. Wir haben hochgerechnet, welche Auswirkungen eine Auswahl der Studierenden nach verschiedenen Selektionsquoten (keine Selektion, ¾, ½ oder ¼ der Stichprobe) auf den Erfolg7Sem hätte. In beiden Gruppen war die Bestehensrate mit 85.5% (HAM-Nat) und 83.7% (NatDenk) ähnlich hoch (siehe Tabelle 4 [Tab. 4]). Hätten wir nur die 25% Besten nach Testergebnis und Abiturnote zugelassen, wären in der HAM-Nat Gruppe alle Studierenden erfolgreich gewesen. In der NatDenk Gruppe wären es 90.5% gewesen. Hier wird noch einmal der Effekt deutlich, den man anhand der ROC-Kurven erkennen kann: für den HAM-Nat wäre es sinnvoll gewesen, eine strenge Selektionsquote anzulegen, während für den NatDenk eine Selektionsquote von 75% am günstigsten gewesen wäre.


Diskussion

Die Studienabbruchquote ist laut Hochschul-Informations-System (HIS) unter den Medizinstudierenden mit 5% relativ gering [8]. Dennoch müssen wir unter den gegebenen Umständen – es gibt wesentlich mehr Bewerber als Studienplätze – die potenziell geeigneten Studienbewerber auswählen. In Anbetracht der Tatsache, dass die Auswahlverfahren und die Studienabbruchquoten auch in den Fokus im Rahmen der Debatte um den Ärztemangel rücken, ist ein Ziel der Studierendenauswahl, diejenigen unter den Studienbewerbern zu identifizieren, die ihr Studium abschließen, denn dies ist die Voraussetzung dafür, den Arztberuf zu ergreifen. Da Studienabbruch schwierig zu erfassen ist, haben wir Studienerfolg als „Physikum nach 7 Semestern bestanden“ operationalisiert. In unserer Stichprobe hatten ca. 15% dieses Kriterium nicht erfüllt. Wir haben uns für diese Operationalisierung entschieden, da die Erfahrung zeigt, dass nur sehr wenige Studierende das Physikum noch nach dem 7. Semester absolvieren. Aufgrund der Dichotomie dieses Studienerfolgsparameters ist ein Vergleich mit den in der Einleitung berichteten Korrelationen zwischen den Testergebnissen und dem metrischen Studienerfolgsparameter Physikumsnote nicht ohne weiteres möglich. Die berichteten Odds Ratios erlauben jedoch einen Vergleich der Prädiktion der einzelnen Parameter.

Beide Tests, der HAM-Nat und der NatDenk, haben für sich genommen eine prädiktive Stärke für das Studienerfolgskriterium Erfolg7Sem. Wenn wir uns an der vom Hochschulrahmengesetz vorgegebenen Auswahlpraxis orientieren und das Testergebnis mit der Abiturnote kombinieren, unterscheiden sich die Tests jedoch. Während der HAM-Nat insbesondere in der Gruppe der Studienanfänger mit guten Abiturnoten zusätzliche prädiktive Informationen für den Studienerfolg liefert, differenziert der NatDenk besser zwischen den Bewerbern mit schlechteren Abiturnoten. Die Auswahl nach HAM-Nat und Abiturnote (Modell 3) hat unter den aktuellen Bedingungen des Medizinerauswahlverfahrens mit vielen guten Bewerbern, aber nur wenigen Studienplätzen, die höchste Vorhersagekraft. In der Gruppe der 25% Besten nach Kombination der Abiturnote mit dem HAM-Nat Ergebnis haben 100% der Studienteilnehmer das Physikum in sieben Semestern bestanden, bei Kombination mit dem NatDenk Ergebnis erhöht sich die Bestehensquote von unselektiert 85,5% lediglich auf 90,5%.

Eine Übertragung dieses Modells auf die Anwendungspraxis ist nur eingeschränkt möglich, auch wegen der geringen Stichprobengröße, der möglicherweise mangelnden Motivation der Teilnehmer, sich im Test anzustrengen und der Zusammensetzung der Stichprobe, in der auch Studierende der Abiturbesten- und Wartezeitquote enthalten waren. Um unsere Ergebnisse auf Allgemeingültigkeit zu prüfen, müssten diese an einer neuen Studierendenkohorte validiert werden.

Ziel der Studie war zu untersuchen, ob der HAM-Nat ähnliche Zusammenhänge zum Studienerfolg aufweist wie das Testmodul NatDenk. Wir wollen keine Aussagen über den TMS im Ganzen treffen. Bestätigt hat sich die Annahme, dass der HAM-Nat und der NatDenk auf unterschiedliche Konstrukte zurückgreifen. Wir sehen einen Vorteil des HAM-Nat in der relativen Unabhängigkeit des Testergebnisses von der Abiturnote. Wir haben somit ein Kriterium eingeführt, welches insbesondere im Bereich der Spitzenleistungen eine Differenzierung von Studienbewerbern erlaubt und auch in dieser schon stark vorselektierten Stichprobe noch prädiktive Stärke für den Studienerfolg besitzt.


Danksagung

Wir danken dem Dekan Prof. U. Koch-Gromus und Herrn Dr. B. Andresen für Anregungen und lebhafte Diskussionen und ihre Unterstützung, Herrn D. Münch-Harrach und Herrn C. Kothe für ihre Unterstützung bei der Datenverarbeitung sowie Herrn N. Feddersen für Hilfe bei der Übersetzung. Diese Studie wird durch den Förderfonds Lehre des Dekanates der Medizinischen Fakultät Hamburg unterstützt.


Interessenkonflikt

Die Autoren erklären, dass sie keine Interessenkonflikte im Zusammenhang mit diesem Artikel haben.


Literatur

1.
Hampe W, Hissbach J, Kadmon M, Kadmon G, Klusmann D, Scheutzel P. Wer wird ein guter Arzt? Verfahren zur Auswahl von Studierenden der Human- und Zahnmedizin. Bundesgesundheitsbl Gesundheitsforsch Gesundheitsschutz. 2009;52(8):821-830. DOI: 10.1007/s00103-009-0905-6 Externer Link
2.
Deutscher Bundestag. Hochschulrahmengesetz. BGBI. 2005;I:3835. Zugänglich unter/available from: http://www.bmbf.de/pub/HRG_20050126.pdf Externer Link
3.
Trost G, Flum F, Fay E, Klieme E, Maichle U, Meyer M, Nauels HU. Evaluation des Tests für Medizinische Studiengänge (TMS): Synopse der Ergebnisse. Bonn: ITB; 1998.
4.
Trost G. Test für Medizinische Studiengänge (TMS): Studien zur Evaluation, 20. Arbeitsbericht: Institut für Test- und Begabungsforschung. Bonn: ITB; 1996.
5.
Trapmann S, Hell B, Weigand S, Schuler H. Die Validität von Schulnoten zur Vorhersage des Studienerfolgs - eine Metaanalyse. Z Padagog Psychol. 2007;21(1):11-27. DOI: 10.1024/1010-0652.21.1.11 Externer Link
6.
Hampe W, Klusmann D, Buhk H, Muench-Harrach D, Harendza S. Reduzierbarkeit der Abbrecherquote im Humanmedizinstudium durch das Hamburger Auswahlverfahren für Medizinische Studiengänge - Naturwissenschaftsteil (HAM-Nat). GMS Z Med Ausbild. 2008;25(2):Doc82. Zugänglich unter/available from: http://www.egms.de/static/de/journals/zma/2008-25/zma000566.shtml Externer Link
7.
Hissbach J, Klusmann D, Hampe W. Reliabilität des Hamburger Auswahlverfahrens für Medizinische Studiengänge, Naturwissenschaftsteil (HAM-Nat). GMS Z Med Ausbild. 2011;28(3):Doc44. DOI: 10.3205/zma000756 Externer Link
8.
Heublein U, Schmelzer R, Sommer D, Wank J. Die Entwicklung der Schwund- und Studienabbruchquoten an den deutschen Hochschulen. Hannover: HIS Hochschul-Informations-System; 2008.