gms | German Medical Science

GMS Journal for Medical Education

Gesellschaft für Medizinische Ausbildung (GMA)

ISSN 2366-5017

Werden die Ergebnisse von Fragebögen zur Messung nicht-kognitiver Eigenschaften im Rahmen des Auswahlverfahrens für Medizinstudienplätze durch soziale Erwünschtheit verzerrt?

Artikel Studierendenauswahl

  • author Katrin U. Obst - Universität zu Lübeck, Institut für Sozialmedizin und Epidemiologie, Lübeck, Deutschland
  • author Linda Brüheim - Universität zu Lübeck, Dezernat Qualitätsmanagement und Organisationsentwicklung, Lübeck, Deutschland
  • author Jürgen Westermann - Universität zu Lübeck, Institut für Anatomie, Lübeck, Deutschland
  • author Alexander Katalinic - Universität zu Lübeck, Institut für Sozialmedizin und Epidemiologie, Lübeck, Deutschland
  • corresponding author Thomas Kötter - Universität zu Lübeck, Institut für Sozialmedizin und Epidemiologie, Lübeck, Deutschland

GMS J Med Educ 2016;33(5):Doc75

doi: 10.3205/zma001074, urn:nbn:de:0183-zma0010749

Dieses ist die deutsche Version des Artikels.
Die englische Version finden Sie unter: http://www.egms.de/en/journals/zma/2016-33/zma001074.shtml

Eingereicht: 6. Januar 2016
Überarbeitet: 4. August 2016
Angenommen: 12. August 2016
Veröffentlicht: 15. November 2016

© 2016 Obst et al.
Dieser Artikel ist ein Open-Access-Artikel und steht unter den Lizenzbedingungen der Creative Commons Attribution 4.0 License (Namensnennung). Lizenz-Angaben siehe http://creativecommons.org/licenses/by/4.0/.


Zusammenfassung

Zielsetzung: Eine stärkere Berücksichtigung nicht-kognitiver Eigenschaften in der Studienplatzvergabe im Fach Medizin wäre prinzipiell wünschenswert. Der Einsatz psychometrischer Fragebögen könnte eine ökonomische Ergänzung zum Auswahlgespräch, das vielerorts Teil des Auswahlverfahrens der Hochschulen (AdH) ist, darstellen. Diese Studie untersucht, inwiefern Ergebnisse psychometrischer Fragebögen zur Erfassung nicht-kognitiver Eigenschaften wie Persönlichkeit, Empathie und Stress-Resilienz anfällig für Verzerrungen durch sozial erwünschtes Antwortverhalten sind, wenn Sie im Kontext der Studienplatzvergabe im Fach Medizin eingesetzt werden.

Methodik: Die Studie fand im Rahmen des AdH der Universität zu Lübeck im August 2015 statt. Untersucht wurden folgende Fragebögen: NEO-FFI, SPF und AVEM. In einem experimentellen 2x1-Zwischensubjekt-Design wurde das Antwortverhalten zwischen einer vermeintlichen Auswahlbedingung und einer Kontrollbedingung verglichen. In der Auswahlbedingung wurde den Bewerberinnen und Bewerbern suggeriert, dass die Fragebögen Teil des Auswahlprozesses seien. In der Kontrollbedingung wurde im Vornherein mitgeteilt, dass die Fragebögen Teil einer wissenschaftlichen Begleitstudie sind.

Ergebnisse: Für alle untersuchten Fragebögen weisen die Ergebnisse Unterschiede auf, die auf soziale Erwünschtheit hindeuten. Dabei sind nicht die gesamten Fragebögen betroffen, sondern einzelne Subskalen.

Schlussfolgerung: Die Aussagekraft der untersuchten Fragebögen für den Einsatz in der Auswahlsituation muss in Frage gestellt werden. Zukünftige Studien müssen untersuchen, inwiefern sich die hier gefundenen Unterschiede tatsächlich auf den Auswahlprozess auswirken und welche Implikationen sich daraus für deren Einsatz bei der Studienplatzvergabe im Fach Medizin ergeben.

Schlüsselwörter: Medizinische Ausbildung, Auswahlverfahren, psychometrische Testung, Persönlichkeitsinventa, Soziale Erwünschtheit


1. Einleitung

Seit Jahren bewerben sich konstant etwa 5 Abiturientinnen und Abiturienten auf einen Medizinstudienplatz [1]. Bisher ist die Abiturnote bei der Studienplatzvergabe das Hauptkriterium. Um - in engen gesetzlichen Grenzen - auch Auswahlkriterien zur Anwendung kommen zu lassen, die stärker auf klinisch-praktische bzw. nicht kognitive Eigenschaften abzielen, werden an vielen Hochschulen bis zu 60% der Medizinstudienplätze im Rahmen des Auswahlverfahrens der Hochschulen (AdH) vergeben. Auch im AdH ist die Abiturnote allerdings das wichtigste Kriterium [2]. Dies wird von verschiedenen Interessengruppen kritisiert, eine Reform des Zulassungsverfahrens gefordert [3], [4], [http://www.aerzteblatt.de/nachrichten/sw/Studienplatzvergabe?nid=63689].

Problematisch an der Abiturnote als Hauptauswahlkriterium ist, dass sie zwar die Einhaltung der Regelstudienzeit und gute Noten vorhersagt [5], [6], [7]. Eigenschaften, die einen guten Arzt/eine gute Ärztin ausmachen, wie etwa klinisch-praktische Fähigkeiten, Empathie, Stress-Resilienz und bestimmte Persönlichkeitseigenschaften werden durch die Abiturnote eher nicht prädiziert [8]. Dabei zeigen Studien, dass auch solche für Fakultäten und Gesellschaft wünschenswerte nicht-kognitive Eigenschaften eine Vorhersagekraft für ein erfolgreiches Medizinstudium und für die Frage, wer ein guter Arzt/eine gute Ärztin wird, besitzen [9], [10]. So können Voltmer et al. belegen, dass arbeitsbezogene Verhaltens- und Erlebensmuster einen bedeutenden Einfluss auf die Gesundheit von Medizinstudierenden und jungen Ärztinnen und Ärzten haben [11], [12], [13]. Diese ist wiederum Grundvoraussetzung für einen kompetenten und einfühlsamen Umgang mit Patienten [14], [15]. Ärztliche Empathie scheint nicht nur die Patientenzufriedenheit, sondern auch die Richtigkeit von Diagnosen und den Behandlungserfolg positiv zu beeinflussen [16]. Bestimmte Persönlichkeitseigenschaften, z.B. Offenheit für Erfahrungen und Verträglichkeit, sind wiederum mit Empathiefähigkeit [17] und auch direkt mit Patientenzufriedenheit [18] verknüpft, nicht zuletzt aber auch mit Studienerfolg [19].

An einigen deutschen Hochschulen, unter anderem in Lübeck, sind daher Auswahlgespräche zur Erfassung nicht-kognitiver Eigenschaften Teil des AdH (z.B. [20], [21], [22]). Diese meist anhand eines Leitfadens von einer Kommission durchgeführten Gespräche sind ressourcenintensiv und von unklarer Validität [23]. Unter anderem deswegen wird der ergänzende Einsatz validierter Fragebogeninstrumente empfohlen [24]. Die Erfahrungen mit einer fragebogengestützten Erfassung nicht-kognitiver Eigenschaften im Rahmen des AdH sind allerdings bisher äußert begrenzt. Zwar gibt es Fragebögen, die sich im wissenschaftlichen Kontext bewährt haben [25], [26], [27]. Unklar ist jedoch, ob die mit diesen Fragebögen erzielten Ergebnisse in der Auswahlsituation durch sozial erwünschte Antworten beeinflusst werden [28], [29]. In diesem Fall wären die Antworten in den Fragebögen wenig aussagekräftig und kaum hilfreich in der Entscheidung um die Studienplatzvergabe. Bevor das AdH also durch fragebogengestützte Messungen nicht-kognitiver Eigenschaften ergänzt werden kann, muss deren Anfälligkeit für soziale Erwünschtheit überprüft werden. Eine geringe Anfälligkeit wäre die Voraussetzung dafür, dass diese als aussagekräftige Messinstrumente in das AdH aufgenommen werden könnten.

Aufbauend auf den zuvor genannten Studien zur Frage, welche Eigenschaften vorhersagen, wer am wahrscheinlichsten ein guter Arzt/eine gute Ärztin werden könnte, konzentrierte sich diese Studie daher zum einen auf Empathie und Persönlichkeitseigenschaften, zum anderen auf bestimmte Verhaltens- und Erlebensweisen im Zusammenhang mit Studium und Arbeit.

Dabei lautete die Fragestellung dieser Studie: Sind ausgewählte Fragebögen zur Erfassung der genannten nicht-kognitiven Eigenschaften im Rahmen des AdH anfällig für Verzerrungen durch soziale Erwünschtheit?

Es wurde erwartet, dass Bewerberinnen und Bewerber im Kontext des AdH eine erhöhte Tendenz aufweisen, sich im Sinne einer Tendenz zu sozial erwünschtem Antworten möglichst positiv im Sinne einer/eines guten Studierenden und angehenden Ärztin/Arztes darzustellen.


2. Methoden

2.1 Stichprobe

Untersucht werden sollten Medizinstudienplatzbewerberinnen und -bewerber, die 2015 am Auswahlgespräch im Rahmen des AdH der Universität zu Lübeck teilnahmen. Insgesamt wurden 2015 240 Bewerberinnen und Bewerber zu einem Auswahlgespräch eingeladen, 228 folgten dieser Einladung. Hiervon konnten 226 Bewerberinnen und Bewerber in die Studie eingeschlossen werden (siehe Tabelle 1 [Tab. 1]), 2 nahmen nicht teil.

2.2 Verwendete Instrumente

Es wurden die folgenden Fragebögen auf ihre Einsatzfähigkeit im AdH überprüft:

SPF

Der SPF [25] ist eine Übersetzung und Überarbeitung des Interpersonal Reactivity Index von Davis [30]. Empathie wird hierbei durch vier Facetten konzeptualisiert:

1.
Perspective taking (die Fähigkeit, die Sichtweise des Gegenübers einzunehmen),
2.
Fantasy (die Fähigkeit, sich spontan in fiktive Figuren hineinzuversetzen),
3.
Empathic concern (die Fähigkeit zu fremdorientierten Emotionen wie z.B. Mitleid) und
4.
Personal distress (eigenfokussierte Emotionen wie etwa Unruhe, die in engen oder problematischen interpersonellen Interaktionen auftreten können).

Als eigenfokussierte Emotion geht Personal distress nicht in die Berechnung des Gesamt-Empathiewertes mit ein.

Zur Erfassung von Empathie im medizinischen Kontext ist die Jefferson Scale for Physician Empathy [31] möglicherweise geläufiger. Aus ihrer Itemformulierung ist ihr Zweck jedoch sehr leicht ableitbar, was sie stark anfällig für Tendenzen sozialer Erwünschtheit macht. Aus diesem Grund haben wir uns für eine weniger offensichtliche Messung von Empathie entscheiden, auch wenn diese nicht spezifisch auf den medizinischen Kontext zugeschnitten ist.

NEO-FFI

Das NEO-FFI nach Costa & McCrae (deutsche Übersetzung von Borkenau & Ostendorf [26]) ist ein Persönlichkeitsfragebogen, der Persönlichkeit auf der Basis des Big-Five-Modells misst und Persönlichkeit anhand folgender fünf, voneinander unabhängiger Faktoren beschreibt: Neurotizismus, Extraversion, Offenheit für Erfahrungen, Gewissenhaftigkeit, Verträglichkeit.

Neurotizismus umfasst dabei Eigenschaften wie Nervosität und Unsicherheit, aber auch z.B. unangemessene Reaktionen auf Stress. Extraversion umschreibt u.a. das Ausmaß an Geselligkeit oder Optimismus. Offenheit für Erfahrungen erfragt inwiefern neue Erfahrungen oder Abwechslung wertgeschätzt werden sowie das Ausmaß an Kreativität und Wissbegierde. Verträglichkeit erfasst soziale Emotionen und Eigenschaften wie Altruismus, Vertrauen, Kooperativität und Nachgiebigkeit. Gewissenhaftigkeit umschreibt Eigenschaften wie Ordnungsliebe, Zuverlässigkeit und Disziplin.

Auf 60 Items wird dazu die Zustimmung bzw. Ablehnung mittels einer 5 stufigen Likert-Skala erfragt. Über die Items eines Faktors wird ein Mittelwert berechnet.

AVEM

Der AVEM [27] ist ein mehrdimensionales, persönlichkeitsdiagnostisches Verfahren, mit dem Verhalten und Erleben im Hinblick auf berufliche Arbeitsbelastungen und ihr Einfluss auf Gesundheit erfasst werden. Dazu werden mittels einer 5-stufigen Likertskala Selbsteinschätzungen zu den folgenden 11 Dimensionen erfasst:

1.
Subjektive Bedeutsamkeit der Arbeit,
2.
Beruflicher Ehrgeiz,
3.
Verausgabungsbereitschaft,
4.
Perfektionsstreben,
5.
Distanzierungsfähigkeit,
6.
Resignationstendenz bei Misserfolgen,
7.
Offensive Problembewältigung,
8.
Innere Ruhe und Ausgeglichenheit,
9.
Erfolgserleben im Beruf,
10.
Lebenszufriedenheit und
11.
Erleben sozialer Unterstützung.

Aus dem Zusammenspiel der 11 Dimensionen können mittels Clusteranalyse vier verschiedene Profile bzw. Verhaltens- und Erlebensmuster abgeleitet werden:

  • Muster G („Gesundheit“): hohes, aber nicht exzessives Arbeitsengagement bei gleichzeitig hoher Widerstandskraft und positiven Emotionen wie etwa Lebenszufriedenheit oder dem Erleben sozialer Unterstützung.
  • Muster S („Schutz / Schonung“): vermindertes Arbeitsengagement bei gleichzeitig hoher Distanzierungsfähigkeit und Lebenszufriedenheit.
  • Muster A („Selbstüberforderung“): hohes Arbeitsengagement bei niedriger Widerstandsfähigkeit und nur eingeschränkter Lebenszufriedenheit.
  • Muster B („Burnout“): niedriges Arbeitsengagement, vor allem niedrige Bedeutsamkeit der Arbeit und niedriger beruflicher Ehrgeiz mit jedoch verminderter Distanzierungsfähigkeit, einer hohen Resignationstendenz und einer niedrigen Lebenszufriedenheit.

Im Rahmen dieser Studie kam die auf die Situation von Studierenden angepasste Version mit 44 Items zum Einsatz.

Bei den mittels SPF, NEO-FFI und AVEM erhobenen Angaben handelt es sich um Selbstauskünfte, nicht um objektiv gemessene Eigenschaften.

2.3 Studiendesign

Die Studie umfasst zwei Versuchsbedingungen, denen die Bewerberinnen und Bewerber zufällig zugeordnet wurden (einfaktorielles experimentelles Design). Dabei wurden jeweils die 12 zeitgleich für das Auswahlgespräch eingeteilten Bewerberinnen und Bewerber abwechselnd einer der beiden im Folgenden beschriebenen Bedingungen zugeordnet und computergestützt direkt im Anschluss an das Auswahlgespräch befragt. Die Zuteilung der Zeiten war dabei im Vorfeld mittels computergenerierter Zufallszahlen durch das Organisationsteam der Auswahlgespräche erfolgt.

Der ersten Gruppe (Bedingung vermeintliche Auswahlsituation) wurde mittels des Instruktionstextes (Auszug: „Sollte das Urteil der Auswahlkommission nicht eindeutig sein, werden die Ergebnisse dieses Fragebogens uns dabei helfen, die Studienplätze möglichst gerecht auf die eingeladenen Bewerber(innen) zu verteilen.“) suggeriert, dass die Fragebögen Teil des Auswahlverfahrens seien und deren Ergebnisse in die Entscheidung über die Zulassung zum Medizinstudium einfließen würden. Eine Studienaufklärung über die Studie und ihre Ziele erfolgte durch die Versuchsleiterin direkt im Anschluss.

Die zweite Gruppe (Kontrollbedingung wissenschaftliche Studie) wurde vorab darüber informiert, dass es sich um eine wissenschaftliche Studie handelt (Auszug aus dem Instruktionstext: „Wir möchten Sie einladen, eine Reihe von Fragen zu beantworten und damit zur Verbesserung des Auswahlverfahrens in der Zukunft beizutragen.“), jedoch nicht darüber, dass soziale Erwünschtheit Gegenstand dieser Studie war. Dabei wurde explizit darauf hingewiesen, dass die Beantwortung der Fragen keinerlei Einfluss auf das Auswahlgespräch hat.

Mittels dieser Versuchsanordnung konnte die Beantwortung der Fragebögen unter der Bedingung einer für die weitere berufliche Biographie der Bewerberinnen und Bewerber entscheidende Auswahlsituation mit der Beantwortung derselben Fragebögen unter der üblichen Bedingung einer wissenschaftlichen Befragung verglichen werden. So sollte geprüft werden, ob und wenn ja, wie sich die Beantwortung der ausgewählten Fragebögen durch eine vermeintliche Auswahlsituation verändert, also ob sie anfällig für Tendenzen der sozialen Erwünschtheit ist [28], [29].

Mittels einer zusätzlich erhobenen Skala zur sozialen Erwünschtheit (SES-17 [32]) sollte getestet werden, inwiefern das Auswahlverfahren überhaupt die Tendenz zur sozialen Erwünschtheit gegenüber einer wissenschaftlichen Studie erhöht. Diese Skala dient als Kontrolle für die experimentelle Manipulation.

Am Ende des Fragebogens wurde den Bewerberinnen und Bewerbern die Gelegenheit gegeben, in einem Freitextfeld Kommentare zur Befragung abzugeben, die in die Auswertung mit einbezogen wurden.

2.4 Auswertung

Die Fragebogendaten wurden in die Statistiksoftware IBM SPSS Statistics (Version 22) importiert und mit dieser ausgewertet.

Bei allen Gruppenvergleichen wurde statistisch für Alter, Geschlecht und Abiturnote kontrolliert. Zur Kontrolle der α–Kumulation bei mehrfachem Testen wurde fragebogenweise eine Bonferroni-Korrektur vorgenommen.

2.5 Ethik

Um die Täuschung aufrecht zu erhalten, konnte in der Bedingung vermeintliche Auswahlsituation nicht vorab auf die Freiwilligkeit der Teilnahme hingewiesen werden. Direkt im Anschluss an die Befragung erfolgte daher die Aufklärung mündlich durch die Versuchsleiterin sowie zusätzlich in schriftlicher Form. Es wurde eine nachträgliche schriftliche Einverständniserklärung eingeholt. Bei fehlendem Einverständnis wären die Daten gelöscht worden. Alle Teilnehmerinnen und Teilnehmer, die einen Fragebogen ausgefüllt hatten, erklärten jedoch im Nachhinein ihr Einverständnis. Das Vorgehen war zuvor mit der Ethikkommission der Universität zu Lübeck beraten und positiv von dieser begutachtet worden (Aktenzeichen 15-072).


3. Ergebnisse

Es wurde zunächst geprüft, ob die Bewerberinnen und Bewerber der Bedingung vermeintliche Auswahlsituation höhere Werte auf der Skala zur sozialen Erwünschtheit (SES-17) aufweisen als die Bewerberinnen und Bewerber der Bedingung wissenschaftliche Studie. Ein statistischer Unterschied konnte nicht gezeigt werden (wissenschaftliche Studie: M=13.11, SD=2.78 vs. vermeintliche Auswahlsituation: M=13.42, SD=2.42, F[1,220]=0.53, n.s.).

Dennoch zeigen sich einzelne Unterschiede in allen verwendeten Fragebögen zwischen den beiden Versuchsbedingungen, die eine Anfälligkeit für Verzerrungen nahelegen (siehe Abbildung 1 [Abb. 1], Abbildung 2 [Abb. 2], Abbildung 3 [Abb. 3] und Tabelle 2 [Tab. 2]).

So weist der Gesamtwert der Empathieskala einen signifikanten Unterschied auf. Bewerberinnen und Bewerber in der Bedingung vermeintliche Auswahlsituation scheinen signifikant empathischer zu sein als in der Kontrollbedingung. Betrachtet man die einzelnen Facetten des SPFs, zeigt sich, dass dieser Unterschied primär auf einen signifikanten Unterschied in der Facette Perspective taking zurückgeführt werden kann (siehe Abbildung 1 [Abb. 1]).

Weiterhin haben Bewerberinnen und Bewerber in der Bedingung vermeintliche Auswahlsituation höhere Werte für die Faktoren Neurotizismus und Verträglichkeit des Persönlichkeitsfragebogens NEO-FFI als in der Kontrollbedingung. Der Unterschied im Faktor Verträglichkeit ist jedoch nach Bonferroni-Korrektur für multiples Testen nicht mehr signifikant (siehe Abbildung 2 [Abb. 2]).

Für die 11 Dimensionen des AVEM ergibt sich folgendes Bild (siehe Abbildung 3 [Abb. 3]): Bewerberinnen und Bewerber in der Bedingung vermeintliche Auswahlsituation haben höhere Scores für Offensive Problembewältigung. Weiterhin erreichen sie höhere Scores für die Dimensionen Subjektive Bedeutsamkeit der Arbeit, Beruflicher Ehrgeiz und Innere Ruhe/Ausgeglichenheit. Die letzten drei Dimensionen sind jedoch nur unkorrigiert signifikant. Bemerkenswerterweise führen die Unterschiede in den Dimensionen des AVEM dazu, dass Bewerberinnen und Bewerber der Bedingung vermeintliches Auswahlgespräch eine etwa drei Mal höhere Wahrscheinlichkeit haben, dem Muster G des AVEM zugeordnet zu werden als Bewerberinnen und Bewerber der Bedingung wissenschaftliche Studie (OR=3.15, WALD[1]=5.35, p=.03). Da die übrigen Muster in dieser Stichprobe unabhängig von der experimentellen Manipulation relativ selten auftraten (Muster S: n=4; Risikomuster A: n=19; Risikomuster B: n=2), wurde auf ihre Auswertung verzichtet.

Es können also für jede der hier ausgewählten Skalen signifikante Unterschiede zwischen den beiden Versuchsbedingungen nachgewiesen werden. Diese Unterschiede weisen kleine bis mittlere Effektstärken auf (siehe Tabelle 2 [Tab. 2]).

Die Erwartung verzerrter Antworten in den Fragebögen zeigt sich auch in einigen Kommentaren, die die Befragten im Rahmen der Evaluation des Auswahlgesprächs am Ende des Tages gemacht haben: Von insgesamt 20 Kommentaren zur Studie bezogen sich insgesamt acht Kommentare eher auf allgemeine Einschätzungen, wie etwa ein Begrüßen derartiger wissenschaftlicher Studien oder Zweifel an deren Aussagekraft. Vier Teilnehmer der Bedingung vermeintliche Auswahlsituation hatten Zweifel, ob diese Fragen wirklich Teil des Auswahlverfahrens seien. Insgesamt sechs Kommentare bezogen sich auf Aspekte der sozialen Erwünschtheit. Tatsächlich äußerten Befragte beider Versuchsbedingungen Bedenken hinsichtlich verzerrter Antworten, wenn Fragebögen Teil des Auswahlverfahrens sein würden (siehe Tabelle 3 [Tab. 3]). Auch wenn diese sechs Kommentare kein repräsentatives Meinungsbild darstellen, sie decken sich doch gut mit der Richtung der Unterschiede, die wir in den Fragebögen zwischen den Versuchsbedingungen zeigen konnten.


4. Diskussion

Diese Studie prüft die Frage, inwiefern bestimmte etablierte Fragebögen, die Persönlichkeit, Empathie und den Umgang mit Stress messen, im Rahmen des AdH anfällig für sozial erwünschtes Antwortverhalten sind.

Die Ergebnisse zeigen, dass die mit allen ausgewählten Fragebögen erzielten Scores durch den Einsatz in einer Auswahlsituation beeinflusst werden. Selbst nach Bonferroni-Korrektur finden sich statistisch signifikante Unterschiede in Subskalen aller verwendeten Instrumente. Die Unterschiede zeigen dabei kleine bis mittlere Effektstärken [33]. Zudem scheinen sich einzelne Unterschiede im AVEM aufzukumulieren, was sich in einer mehr als dreifach so großen Wahrscheinlichkeit für ein Muster G in der vermeintlichen Auswahlbedingung im Vergleich zu Kontrollbedingung wissenschaftliche Studie äußert. Allein dieser deutliche Unterschied ist bemerkenswert.

Der Einsatz von Persönlichkeitsfragebögen in Personalauswahlverfahren wird vor allem in der Persönlichkeits- sowie der Arbeits- und Organisationspsychologie kontrovers diskutiert. Studien, bei denen Probandinnen und Probanden explizit aufgefordert wurden, sich möglichst gut darzustellen (fake-good-Paradigma), zeigen durchaus erwartungs- und stereotypenkonformes Antwortverhalten [34], [35], [36], [37], [38]. Persönlichkeitstests in Auswahlsituationen scheinen demnach tatsächlich anfällig für soziale Erwünschtheit zu sein. Andere Studien hingegen belegen kaum Einflüsse sozialer Erwünschtheit auf die Beantwortung von Persönlichkeitstests [39], [40], [41]. Insbesondere, wenn Probandinnen und Probanden in eine vermeintlich reale Auswahlsituation gebracht wurden, scheinen die Effekte sozialer Erwünschtheit kleiner zu werden [40], was auch die relativ geringen Effektstärken dieser Studie erklären könnte. Auch könnte der zunächst überraschende Befund, dass sich Bewerberinnen und Bewerber in der vermeintlichen Auswahlsituation neurotischer dargestellt haben als in der Kontrollbedingung, dadurch erklärt sein, dass es sich um kein reines fake-good-Paradigma handelte. Die Bewerberinnen und Bewerber waren vielmehr gefordert, sich möglichst positiv im Sinne einer / eines guten Studierenden und angehenden Ärztin/Arzt darzustellen. Möglicherweise haben sie daher bewusst vermieden, sich allzu selbstsicher darzustellen, gehört doch ständige Selbstreflexion zum Bild eines „guten Arztes“/einer „guten Ärztin“ [42].

Vergleichbare Studien zur Anfälligkeit von Empathie-Fragebögen oder des AVEM für sozial erwünschtes Antworten gibt es nach aktuellem Kenntnisstand nicht.

Da die Fallzahl von 226 eher zu gering war, um Unterschiede in diesem Effektstärkenbereich zuverlässig zu detektieren, werden die Auswirkungen sozialer Erwünschtheit in dieser Studie eher unterschätzt [43]. Auch wenn die gefundenen Unterschiede auf den ersten Blick eher vereinzelt oder gering erscheinen mögen, kann also aufgrund der vorliegenden Daten nicht davon ausgegangen werden, dass die Fragebögen in einer Auswahlsituation tatsächlich valide Persönlichkeit, Empathie und Stressresilienz messen.

Einschränkend muss angemerkt werden, dass zwar Unterschiede in den ausgewählten Fragebögen zwischen den Versuchsbedingungen nachgewiesen werden können, ein signifikanter Unterschied in der Skala für soziale Erwünschtheit zwischen den Bedingungen jedoch nicht. Daraus könnte man schließen, dass diese Verzerrungen möglicherweise andere Ursachen als eine erhöhte Tendenz zur sozialen Erwünschtheit haben. Dies kann auf der Basis dieser Ergebnisse nicht ausgeschlossen werden. Die hier verwendete Skala SES-17 [32] erfasst soziale Erwünschtheit mit sehr globalen Alltagssituationen, die wenig mit der Studienplatzvergabe oder einen Auswahlprozess allgemein zu tun haben. Soziale Erwünschtheit hingegen umschreibt eine Verhaltenstendenz, bei der eine Person bemüht ist, sich möglichst konform mit situationsspezifischen Erwartungen und Normen zu verhalten [29]. Es wäre daher denkbar, dass das Auswahlverfahren soziale Erwünschtheit deutlich kontext-spezifischer erhöht und die SES-17 somit nicht empfindlich genug ist, um experimentell induzierte Unterschiede zu messen. Möglicherweise hätte eine stärkere Formulierung im Instruktionstext der Bedingung vermeintliche Auswahlsituation (siehe Methoden) zu einem stärkeren Unterschied zwischen den Bedingungen geführt. Betrachtet man jedoch die Richtung der Unterschiede in den Fragebögen, deuten diese durchaus darauf hin, dass die Bewerberinnen und Bewerber in der Bedingung vermeintliche Auswahlsituation bemüht waren, sich möglichst positiv im Sinne einer/eines guten Studierenden und angehenden Ärztin/Arzt darzustellen. Dies wird auch durch die Freitextkommentare der Evaluation des Auswahlgesprächs unterstützt. Dies spricht dafür, dass die Skala SES-17 als Kontrollskala möglicherweise nicht gut geeignet war.

Insgesamt zeigen die Ergebnisse dieser Studie, dass ein Einsatz etablierter Fragebögen zur Messung nicht-kognitiver Eigenschaften in der Vergabe der Medizinstudienplätze zwar wünschenswert ist, jedoch mit Vorsicht geschehen sollte. Ratsam wäre eine weitere Evaluation von Fragebögen entsprechend der oben diskutierten Fragen und ggf. eine Überarbeitung dieser, um sie weniger anfällig für Verzerrungen zu machen. Inwiefern sich die gefundenen Einschränkungen auf den tatsächlichen Auswahlprozess auswirken, etwa, weil Bewerber mit einer hohen Tendenz zur sozialen Erwünschtheit höhere Rangplätze erhalten und daher eher in den Genuss eines Studienplatzes kommen oder inwiefern dies indirekt Auswirkungen auf die Frage hat, ob auf diese Weise wirklich diejenigen ausgewählt werden, die mit höherer Wahrscheinlichkeit gute Mediziner werden, bleibt Gegenstand zukünftiger Forschung [44]. Die hier vorgestellten Ergebnisse belegen jedoch, dass derartige Forschung dringend nötig ist, wenn psychometrische Verfahren zukünftig ergänzend im Auswahlverfahren der Hochschulen zum Einsatz kommen sollen.


5. Schlussfolgerungen

  • Der Einsatz etablierter Fragebögen zur Erfassung nicht-kognitiver Eigenschaften im Rahmen des AdH scheint nicht unproblematisch zu sein: Die hier überprüften Fragebögen weisen Einflüsse sozialer Erwünschtheit auf. Wenn die Ergebnisse jedoch durch den Wunsch, sich möglichst positiv im Sinne eines idealen Studierenden oder angehenden Arztes dazustellen, beeinflusst werden, sind ihr prädiktiver Wert und damit ihr Nutzen für die Studienplatzvergabe unklar.
  • Weitere Forschungsarbeiten zu den tatsächlichen Auswirkungen sozial erwünschter Antworten sowie möglichen alternativen Verfahren sind daher nötig.

Danksagungen

Wir bedanken uns bei Jessica Lückert, Sophia Marie Saftien, Karl Böse, Karen Sievers und Josefin Wagner für die Unterstützung bei der Vorbereitung und Durchführung der Befragungen.


Interessenkonflikt

Die Autoren erklären, dass sie keine Interessenkonflikte im Zusammenhang mit diesem Artikel haben.

Linda Brüheim war im Rahmen ihres Beschäftigungsverhältnisses an der Universität zu Lübeck mit der Auswertung des AdH betraut.

Die Studie wurde aus Eigenmitteln der Universität zu Lübeck, der Sektion Medizin der Universität zu Lübeck und dem Institut für Sozialmedizin und Epidemiologie der Universität Lübeck finanziert.


Literatur

1.
Stiftung für Hochschulzulassung. Daten der bundesweit zulassungsbeschränkten Studiengänge an Hochschulen. Dortmund: Stiftung für Hochschulzulassung; 2014. Zugänglich unter/available from: http://bit.ly/12Vo1xR Externer Link
2.
Stiftung für Hochschulzulassung. Verordnung über die zentrale Vergabe von Studienplätzen durch die Stiftung für Hochschulzulassung. Dortmund: Stiftung für Hochschulzulassung; 2014. Zugänglich unter/available from: http://bitly.com/1wSTw9w Externer Link
3.
Bundesvertretung der Medizinstudierenden in Deutschland e.V. Positionspapier Zulassungsverfahren zum Medizinstudium in Deutschland. Bonn: Bundesvertretung der Medizinstudierenden in Deutschland; 2015. Zugänglich unter/available from: http://bit.ly/1IvhLgh Externer Link
4.
Bundesärztekammer. Stellungnahme der Bundesärztekammer zu den Themen für den "Masterplan Medizinstudium 2020", insbesondere hinsichtlich möglicher Maßnahmenvorschläge. Berlin: Bundesärztkammer; 2015. Zugänglich unter/available from: http://bit.ly/2dlRE0u Externer Link
5.
Salvatori P. Reliability and validity of admissions tools used to select students for the health professions. Adv Health Sci Educ Theory Pract. 2001;6(2):159-175. DOI: 10.1023/A:1011489618208 Externer Link
6.
Ferguson E, James D, Madeley L. Factors associated with success in medical school: systematic review of the literature. BMJ. 2002;324(7343):952–957. DOI: 10.1136/bmj.324.7343.952 Externer Link
7.
Maslov Kruzicevic S, Barisic KJ, Banozic A, Esteban CD, Sapunar D, Puljak L. Predictors of attrition and academic success of medical students: a 30-year retrospective study. PLoS ONE. 2012;7(6):e39144. DOI: 10.1371/journal.pone.0039144 Externer Link
8.
Shen H, Comrey AL. Predicting medical students' academic performances by their cognitive abilities and personality characteristics. Acad Med. 1997;72(9):781–786. DOI: 10.1097/00001888-199709000-00013 Externer Link
9.
Hojat M, Robeson M, Damjanov I, Veloski JJ, Glaser K, Gonnella JS. Students' psychosocial characteristics as predictors of academic performance in medical school. Acad Med. 1993;68(8):635–637. DOI: 10.1097/00001888-199308000-00015 Externer Link
10.
Adam J, Bore M, McKendree J, Munro D, Powis D. Can personal qualities of medical students predict in-course examination success and professional behaviour? An exploratory prospective cohort study. BMC Med Educ. 2012;12:69. DOI: 10.1186/1472-6920-12-69 Externer Link
11.
Voltmer E, Kötter T, Spahn C. Perceived Medical School Stress and the Development of Behavior and Experience Patterns in German Medical Students. Med Teach. 2012;34(10):840–847. DOI: 10.3109/0142159X.2012.706339 Externer Link
12.
Voltmer E, Kieschke U, Spahn C. Arbeitsbezogenes Verhalten und Erleben bei Ärzten im dritten bis achten Berufsjahr. Z Psychosom Med Psychother. 2007;53(3):244–257. DOI: 10.13109/zptm.2007.53.3.244 Externer Link
13.
Kötter T, Tautphäus Y, Obst KU, Voltmer E, Scherer M. Health-promoting factors in the freshman year of medical school: a longitudinal study. Med Educ. 2016;50(6):646–656. DOI: 10.1111/medu.12987 Externer Link
14.
Kjeldstadli K, Tyssen R, Finset A, Hem E, Gude T, Gronvold NT, Ekeberg O, Vaglum P. Life satisfaction and resilience in medical school - a six-year longitudinal, nationwide and comparative study. BMC Med Educ. 2006;6:48. DOI: 10.1186/1472-6920-6-48 Externer Link
15.
Wallace JE, Lemaire JB, Ghali WA. Physician wellness: a missing quality indicator. Lancet. 2009;374(9702):1714–1721. DOI: 10.1016/S0140-6736(09)61424-0 Externer Link
16.
Neumann M, Scheffer C, Tauschel D, Lutz G, Wirtz M, Edelhäuser F. Physician empathy: definition, outcome-relevance and its measurement in patient care and medical education. GMS Z Med Ausbild. 2012;29(1):Doc11. DOI: 10.3205/zma000781 Externer Link
17.
Costa P, Alves R, Neto I, Marvão P, Portela M, Costa MJ. Associations between medical student empathy and personality: a multi-institutional study. PLoS ONE. 2014;9(3):e89254. DOI: 10.1371/journal.pone.0089254 Externer Link
18.
Duberstein P, Meldrum S, Fiscella K, Shields CG, Epstein RM. Influences on patients' ratings of physicians: Physicians demographics and personality. Patient Educ Couns. 2007;65(2):270–274. DOI: 10.1016/j.pec.2006.09.007 Externer Link
19.
Lievens F, Coetsier P, De Fruyt F, De Maeseneer J. Medical students' personality characteristics and academic performance: a five-factor model perspective. Med Educ. 2002;36(11):1050–1056. DOI: 10.1046/j.1365-2923.2002.01328.x Externer Link
20.
Hallfahrt T, Reinke S, Westermann J. Exzellenz und Engagement gesucht. Dtsch Arztebl. 2009;106:A1296–A1298.
21.
Waydhas C, Heue M, Nast-Kolb D. Strukturierte Interviews zur Studienplatzvergabe in der Medizin: Erste Erfahrungen. GMS Z Med Ausbild. 2007;24(4):Doc186. Zugänglich unter/available from: http://www.egms.de/static/de/journals/zma/2007-24/zma000480.shtml Externer Link
22.
Hampe W, Klusmann D, Buhk H, Münch-Harrach D, Harendza S. Reduzierbarkeit der Abbrecherquote im Humanmedizinstudium durch das Hamburger Auswahlverfahren für Medizinische Studiengänge - Naturwissenschaftsteil (HAM-Nat). GMS Z Med Ausbild. 2008;25(2):Doc82. Zugänglich unter/available from: http://www.egms.de/static/de/journals/zma/2008-25/zma000566.shtml Externer Link
23.
Kötter T, Obst K, Brüheim L, Eisemann N, Voltmer E, Katalinic A. Können psychometrische Tests den Erfolg im Auswahlgespräch zum Medizinstudium vorhersagen? Eine Querschnittsstudie an einer deutschen Hochschule. Gesundheitswes. 2015., DOI: 10.1055/s-0035-1554705 Externer Link
24.
Wissenschaftsrat. Empfehlungen zur Reform des Hochschulzugangs. Berlin: Wissenschaftsrat; 2004. Zugänglich unter/available from: http://bit.ly/1Z2Osry Externer Link
25.
Paulus C. Der Saarbrücker Persönlichkeitsfragebogen SPF (IRI) zur Messung von Empathie: Psychometrische Evaluation der deutschen Version des Interpersonal Reactivity Index. Saarbrücken: Universität des Saarlandes; 2009. Zugänglich unter/available from: http://bit.ly/1kHRCmV Externer Link
26.
Borkenau P, Ostendorf F. NEO-Fünf-Faktoren-Inventar. 2., neu normierte und vollständig überarbeitete Auflage. Göttingen: Hogrefe; 2008.
27.
Schaarschmidt U, Fischer AW. Arbeitsbezogenes Verhaltens- und Erlebensmuster. 2. Auflage. Frankfurt am Main: Swets Test Services; 2003.
28.
Edwards AL. The social desirability variable in personality assessment and research. Oak Brook: The Dryden Press; 1957.
29.
Mummendey HD. Methoden und Probleme der Kontrolle sozialer Erwünschtheit (Social Desirability). Z Different Diagn Psychol. 1981;2:199-218. Zugänglich unter/available from: http://bit.ly/1TJtnn3 Externer Link
30.
Davis MH. A multidimensional approach to individual differences in empathy. Austin: University of Texas; 1980. Zugänglich unter/available from: http://bit.ly/22IFq7w Externer Link
31.
Hojat M, Gonnella JS, Nasca TJ, Mangione S, Vergare M, Magee M. Physician empathy: definition, components, measurement, and relationship to gender and specialty. Am J Psychiatry. 2002;159(9):1563–1569. DOI: 10.1176/appi.ajp.159.9.1563 Externer Link
32.
Stöber J. Die Soziale-Erwünschtheits-Skala-17 (SES-17): Entwicklung und erste Befunde zu Reliabilität und Validität. Diagnostica. 1999;45:173-177. DOI: 10.1026//0012-1924.45.4.173 Externer Link
33.
Cohen J. Statistical Power Analysis for the Behavioral Sciences. 2. Auflage. Hillsdale, N.J.: Lawrence Erlbaum Assoc Inc; 1988.
34.
Viswesvaran C, Ones DS. Meta-analyses of fakability estimates: Implications for personality measurement. Educ Psychol Meas. 1999;59:197–210. DOI: 10.1177/00131649921969802 Externer Link
35.
Alliger GM, Dwight SA. A meta-analytic investigation of the susceptibility of integrity tests to faking and coaching. Educ Psychol Meas. 2000;60:59–72. DOI: 10.1177/00131640021970367 Externer Link
36.
Krahé B, Herrmann J. Verfälschungstendenzen im NEO-FFI: Eine experimentelle Überprüfung. Z Different Diagn Psychol. 2003;24:105–117. DOI: 10.1024//0170-1789.24.2.105 Externer Link
37.
Hagemann D, Amelang M, Bartussek D, Stemmler G. Differentielle Psychologie und Persönlichkeitsforschung. 6. vollst. überarb. Aufl. Stuttgart: Kohlhammer; 2006.
38.
Galic Z, Jerneic Ž, Kovacic MP. Do applicants fake their personality questionnaire responses and how successful are their attempts? A case of military pilot cadet selection. Int J Select Assess. 2012;20:229–241. DOI: 10.1111/j.1468-2389.2012.00595.x Externer Link
39.
Ones DS, Viswesvaran C. The Effects of Social Desirability and Faking on Personality and Integrity Assessment for Personnel Selection. Human Perform. 1998;11:245–269. DOI: 10.1080/08959285.1998.9668033 Externer Link
40.
Hossiep R, Paschen M, Mühlhaus O. Persönlichkeitstests im Personalmanagement: Grundlagen, Instrumente und Anwendungen. Göttingen: Hogrefe Verlag; 2000.
41.
Amelang M, Schäfer A, Yousfi S. Comparing verbal and non-verbal personality scales: Investigating the reliability and validity, the influence of social desirability, and the effects of fake good instructions. Psychol Beitr. 2002;44:24–41.
42.
Hibbeler B. Zwischen Samaritertum und Ökonomie: Was ist ein "guter Arzt"? Dtsch Arztebl. 2011;108:A2758.
43.
Faul F, Erdfelder E, Lang A-G, Buchner A. G*Power 3: a flexible statistical power analysis program for the social, behavioral, and biomedical sciences. Behav Res Methods. 2007;39(2):175–191. DOI: 10.3758/BF03193146 Externer Link
44.
Dwight SA, Donovan JJ. Warning: Proceed with caution when warning applicants not to dissimulate. Dallas, TX: Society of Industrial and Organizational Psychology; 1998.
45.
Schmitt N, Oswald FL, Kim BH, Gillespie MA, Ramsay LJ, Yoo TY. Impact of elaboration on socially desirable responding and the validity of biodata measures. J Appl Psychol. 2003;88(6):979–988. DOI: 10.1037/0021-9010.88.6.979 Externer Link
46.
Marcus B. Persönlichkeitstests in der Personalauswahl. Z Psychol. 2003;211:138–148. DOI: 10.1026//0044-3409.211.3.138 Externer Link