gms | German Medical Science

GMS Journal for Medical Education

Gesellschaft für Medizinische Ausbildung (GMA)

ISSN 2366-5017

Wo Cronbach´s alpha nicht mehr reicht: Messzuverlässigkeit bei nicht-homogenen Prüfungen

Kurzfassung Vortrag Humanmedizin

  • corresponding author presenting/speaker Andreas Möltner - Universität Heidelberg, Kompetenzzentrum für Prüfungen in der Medizin, Heidelberg, Deutschland
  • Dieter Schellberg
  • author Steffen Briem - Uniklinikum Heidelberg, Medizinische Klinik, Heidelberg, Deutschland
  • author Thomas Böker - Universitätsklinik Heidelberg, Heidelberg, Deutschland
  • author Jobst-Hendrik Schultz - Universität Heidelberg, Vorklinik im Kompetenzzentrum Prüfungen Baden Würtemberg, Heidelberg, Deutschland
  • author Jana Jünger - Medizinische Universitätsklinik Heidelberg, Innere Medizin, Heidelberg, Deutschland

GMS Z Med Ausbild 2005;22(4):Doc137

Die elektronische Version dieses Artikels ist vollständig und ist verfügbar unter: http://www.egms.de/de/journals/zma/2005-22/zma000137.shtml

Eingereicht: 15. Juli 2005
Veröffentlicht: 18. November 2005

© 2005 Möltner et al.
Dieser Artikel ist ein Open Access-Artikel und steht unter den Creative Commons Lizenzbedingungen (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.de). Er darf vervielfältigt, verbreitet und öffentlich zugänglich gemacht werden, vorausgesetzt dass Autor und Quelle genannt werden.


Gliederung

Workshop

Das "Wissen" oder "Können", welches in einem medizinischen Fach geprüft wird, ist keine eindimensionale Grösse, sondern muss als aus verschiedenen Teilfertigkeiten zusammengesetzt aufgefasst werden. Diese werden z. B. auch durch unterschiedliche Prüfungsformen für theoretisches Wissen und praktische Fertigkeiten erfasst.

Damit stellt sich die Frage nach der Messzuverlässigkeit der Gesamtbewertung, die Verwendung der internen Konsistenz (Cronbachs alpha) als Reliabilitätsmaß kann bei diesen testtheoretisch "nicht-homogenen" Tests zu irreführenden Ergebnissen führen.

Geeignete Verfahren zur Analyse solcher Tests und zur Interpretation der erzielten Ergebnisse werden am Beispiel der Prüfungen im Fach Innere Medizin der Universität Heidelberg vorgestellt. Diese bestehen aus einer Klausur und einem OSCE, deren Einzelreliabilitäten zufrieden stellend gut waren (0.65 bzw. 0.74, r=0.6). Insgesamt ergibt sich für die Gesamtbewertung die sehr gute Reliabilität von 0.84.

Das Vorgehen zeigt, wie medizinische Prüfungen, die zur Gewährleistung einer hohen Validität als heterogene Tests konzipiert werden müssen, in Bezug auf ihre Reliabilität testtheoretisch angemessen zu analysieren sind.