gms | German Medical Science

GMS Journal for Medical Education

Gesellschaft für Medizinische Ausbildung (GMA)

ISSN 2366-5017

Spielbetrieb oder Motivation - was weckt der Einbezug von Software im Biometrie-Unterricht wirklich???

Gambling kick or content motivation - what is really initialized by the introduction of software into medical biometry lessons???

Projekt Humanmedizin

Search Medline for

  • corresponding author Frank Krummenauer - Universitätsklinikum Carl Gustav Carus Dresden, Bereich Klinische Epidemiologie und Gesundheitsökonomie, Dresden, Deutschland
  • Ulrike Weiler - Universitätsklinikum Carl Gustav Carus Dresden, Bereich Klinische Epidemiologie und Gesundheitsökonomie, Dresden, Deutschland

GMS Z Med Ausbild 2005;22(3):Doc56

The electronic version of this article is the complete one and can be found online at: http://www.egms.de/en/journals/zma/2005-22/zma000056.shtml

Received: June 27, 2005
Published: August 15, 2005

© 2005 Krummenauer et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution License (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en). You are free: to Share – to copy, distribute and transmit the work, provided the original author and source are credited.


Zusammenfassung

Hintergrund: Derzeit werden vor allem im Statistik-Unterricht für Anwender zahlreiche interaktive Software- und Lernsysteme entwickelt, von welchen sich neben einer Erhöhung des Verständnisses auch eine Steigerung der Motivation und damit auch der Akzeptanz des Unterrichts bei den Anwendern versprochen wird. Am Mainzer Unterrichtsmodell, welches seit mehreren Jahren die Kurse der Medizinischen Biometrie mit der Software SPSS® durchführt, sollte anhand studentischer Bewertung diese Hoffnung überprüft werden.

Methoden: Nach einer vorbereitenden Intensivvorlesung werden im Praktikum der Medizinischen Biometrie (ehemals "Biomathematik") in Mainz von den Studierenden Aufgaben mittels SPSS® bearbeitet, wobei das Ziel jeder Doppelstunde im wesentlichen die Erstellung einer Ergebnissynopse ist. Im Rahmen des Qualitätsmanagements in der Lehre wurden im Sommersemester 2002 von den Studierenden des ersten klinischen Semesters Angaben zur Akzeptanz dieses Kurses, der vorbereitenden Vorlesung und vor allem des den Kurs unterstützenden SPSS® mittels eines standardisierten Evaluationsbogens erhoben.

Ergebnisse: Der Anteil Studierender, die nach eigener Einschätzung "gut mit SPSS zurecht gekommen" sind, variiert in den 7 parallelen Kursen zwischen 43% und 88% (gepoolter Anteil 58%). Unter diesen Studierenden berichten jedoch nur 30% ein gutes / sehr gutes Verständnis des Praktikumsstoffes, 15% einen guten / sehr guten Lerneffekt im Praktikum. Unter den Studierenden, die nach eigener Angabe "nicht gut mit SPSS zurecht gekommen" sind, betragen diese Anteile jeweils 13%. Unter den Studierenden, die "gut mit SPSS zurecht gekommen" sind, attestieren ferner 70% der einführenden Vorlesung eine gute / sehr gute Verständlichkeit sowie 73% einen guten / sehr guten Lerneffekt; unter den anderen Studierenden betragen diese Anteile jeweils 66%. Nur im Fragebogen-Aspekt "inhaltliche Motivation" zeigt sich beim Vergleich dieser beiden Gruppen Studierender ein signifikanter Unterschied (Likelihood Ratio p<0.001 nach Korrektur für Kursleitereffekte). Weder für die Struktur des Praktikums (p=0.362), dessen Verknüpfung mit der Vorlesung (p=0.165) noch die Kommunikation und Didaktik (p=0.407) zeigten sich nach Korrektur für Dozenteneffekte nennenswerte Tendenzen zugunsten einer positiveren Bewertung des Kurs bei Akzeptanz von SPSS®.

Schlussfolgerung: Mit dem Einbezug einer Software wie SPSS® in den Unterricht können Verständnis und Motivation des für Anwender zumeist schwer zugänglichen Stoffes der Medizinischen Biometrie bestenfalls gesteigert, aber in keinem relevanten Maß geweckt werden. Wie weit diese Erkenntnisse auf explizit für den Unterricht konzipierte Lernsoftware übertragen werden können, muss in unabhängigen Evaluationen überprüft werden.

Schlüsselwörter: Biometrie-Unterricht, Software-Einbezug, Lehrevaluation, Motivation

Abstract

Bachground: Teaching statistics to members of non-mathematical disciplines becomes increasingly based on the involvement of interactive learning software. The latter is expected to both increase understanding and motivation and thereby as well studential acceptance. The teaching model implemented at the Medical Biometry Department in Mainz will be used to consider the value of introducing an interactive software like SPSS® into biometry lessons by means of studential evaluations.

Methods: After an introductory lecture series, the participants of the Medical Biometry (formerly "Biomathematics") practical courses are requested to solve real data exercises by means of the software SPSS®, where each lessons aims to the derivation of a result synopsis summarizing the results of the performed statistical analyses. In summer 2002 the students of this course were asked to fill out a standardized teaching quality assessment questionnaire on the acceptance of the previous lecture series, the practical course lessons and the involvement of the software.

Results: Between the 7 parallel courses the fraction of students reporting "good management with SPSS" varies between 43% and 88% (pooled estimate 58%), but among these students only 30% report a good / very good understanding of the lessons' context and only 15% a good / very good learning effect. Among students with "problems in SPSS management" these fractions both turned out 13%. Among the students with "good management with SPSS", however, 70% considered the understanding during the lecture series as good / very good, 73% reported a good / very good learning effect for the lectures; among the other students both fractions were 13%. These subgrupus only differed significantly for the questionnaire dimension "content motivation" (Likelihood Ratio p<0.001 after correction for teacher effects). Neither the lessons' structure (p=0.362), their relation to the introductory lecture series (p=0.165) nor the teachers' personal and didactical skills (p=0.407) differed significantly between the subgroups of students with and without acceptance of SPSS®.

Conclusion: Introduction of a software like SPSS® can only slightly raise studential understanding and subject-associated motivation, but can hardly create them. However, it must be considered by means of independent evaluations, how far these findings can be transferred to the impact of interactive learning tools on students' motivation and acceptance.

Keywords: biometry education, learning software, teaching quality assessment, motivation


Einleitung

Aktuelle Projekte wenden massive personelle und finanzielle Ressourcen zur Konzeption und Implementation elektronischer Lernmedien auf, welchen speziell im nicht immer geliebten Fach "Medizinische Biometrie" (ehemals "Biomathematik") das Potential einer Motivations- und damit auch Akzeptanzsteigerung bei den Studierenden zugesprochen wird. So naheliegend diese Hypothese gerade bei einem eher mit für Anwender "trockenen" Stoff durchsetzten Fach wie der Biometrie aus Sicht der Dozenten aber auch sein mag, so sehr scheint sie auch eine kritische Hinterfragung auf der Basis von Anwender-Bewertungen wert zu sein. Nachdem bereits an zahlreichen Instituten im Rahmen der Veranstaltung "Biomathematik" bzw. "Medizinische Biometrie" des ersten und dritten klinischen Semesters die verschiedensten Software-Module in den Unterricht einbezogen werden, ist in den letzten 5 Jahren intensiviert deren Nutzen nicht unkritisch diskutiert worden. Während einerseits der mögliche Nutzen im Wecken einer Selbstaktivität zur Beschäftigung mit den Inhalten der Biometrie sowie in der Möglichkeit zur Bearbeitung von "per Hand" nicht lösbaren komplexen Auswertungen festgemacht werden, wird zunehmend Kritik an der Bindung zeitlicher Ressourcen des Unterrichts durch rein technische Hürden und eine Abkehr vom Methodenverständnis hin zur rein technisch-schematischen Umsetzung beschrieben.

Während bei einer Status-Quo-Sondierung der "AG Didaktik der Biometrie" der Biometrischen Gesellschaft im Jahr 1998 der Einbezug von Auswertungs-Software wie SPSS® oder SAS JMP® als viel versprechende und an einigen Standorten als bereits probate Innovation diskutiert wurde, sind derzeit eher interaktive Lernprogramme und Demonstrationsmodule von Interesse. Wie weit sich die obigen befürwortenden sowie kritischen Argumente für den Einbezug solcher Programme in den Studierenden-Unterricht übertragen lassen, hängt sicher von der expliziten Ausgestaltung der Module und deren Einbezug und Gewichtung im Unterrichtsablauf ab. Dennoch scheint sowohl im Hinblick auf die inzwischen mehr als fünfjährige Erfahrung mit den 1998 besprochenen Unterrichts-Modellen wie auch im Hinblick auf die nicht minder hoffnungsfrohe Diskussion der aktuell in Konzeption befindlichen Lernsoftware eine Kommentierung aus Perspektive der "Kunden" ratsam und informativ. Nicht selten hat sich schon gezeigt, dass der Blickwinkel der Biometrie ein anderer ist als der ihrer "Kunden" - bestehende, auch durch den Einbezug von Pädagogen geschürte Hoffnung auf eine Akzeptanzsteigerung des Fachunterrichts durch den Einbezug von Lernsoftware gleich welcher Art sollte jedoch ohne Rückmeldung von Studierenden der Anwendungsfächer nicht zu positiv bewertet werden. Im Rahmen des am Fachbereich Medizin der Universität Mainz etablierten kontinuierlichen Qualitätsmanagements in der Lehre [1] wurde daher ein für die Belange des Unterrichtsfachs "Medizinische Biometrie" (ehemals "Biomathematik") im ersten klinischen Semester spezifischer Evaluationsbogen [2] entwickelt und standardisiert, mit welchem unter anderem auch der Aspekt des Einbezugs von Software und elektronischen Medien bewertet werden kann.


Material und Methoden

Unterrichtskonzept

Nach einer fünf Wochen andauernden Intensivvorlesung (4 Stunden pro Woche, Dozent: F. Krummenauer), in welcher von deskriptiven Methoden (Boxplots, Kaplan/Meier-Methode, Relatives Risiko, NNT etc.) bis hin zu multiplen Regressionsmodellen (logistische und Cox-Regression etc.) die gängigen statistischen Verfahren der Medizinischen Biometrie auf der Basis von Signifikanztests und Konfidenzintervallen präsentiert werden, beginnt ein sich daran anschließendes achtwöchiges Praktikum (1 Doppelstunde pro Woche, 7 parallele Gruppen zu je circa 20 - 25 Studierenden). In diesem werden die in der Vorlesung präsentierten Inhalte an realen Datensätzen eingeübt; Ziel einer jeden Doppelstunde ist die Erstellung einer "Synopse" zu Kernergebnissen des aktuellen Datensatzes entlang anleitender Hinweise, welche Arbeitsschritte dazu bedacht werden sollten. Neben der Auswahl sachgerechter Analysemethoden lernen die Studierenden also auch im Rahmen des zeitlich Machbaren die dafür notwendige Arbeitsmethodik kennen. Die Aufgaben werden von der ersten Doppelstunde an mittels SPSS® bearbeitet, um reale klinische Probleme und große Datensätze einbeziehen zu können. Hierzu wird in der ersten Doppelstunde eine kurze technische Frontal-Einführung in die Software gegeben. Inhaltlich sind die Aufgaben bzw. die ihnen zu Grunde liegenden Datensätze primär aus dem Beratungsbetrieb der Kursleiter erwachsen; die klinischen Anwendungen reichen dabei von experimentellen Studien der Anästhesie und Kardiologie bis hin zu randomisierten Studien der Onkochirurgie. Sowohl in der Vorlesung wie auch im Praktikum besteht ferner noch ein Schwerpunkt-Abschnitt zum Thema Diagnose- und Methodenvergleichsstudien, welcher die hohe Frequenz solcher Projekte im Beratungsbetrieb wieder spiegelt. Neben den SPSS-bezogenen Aufgaben werden ferner in 4 der 8 Doppelstunden jeweils eine Serie von 10-15 Multiple Choice-Fragen bearbeitet, um Detail-Inhalte wie die Gleichwertigkeit von Aussagen auf der Basis von Tests bzw. Konfidenzintervallen besser in Erinnerung zu halten. Am Ende des Semesters ist von den Studierenden eine einstündige Klausur zu absolvieren, die über den Erhalt des Scheins entscheidet; das erfolgreiche Bearbeiten von 6 der 8 SPSS®-basierten Praktikumsaufgaben ist die Zulassungsbedingung für diese Klausur.

Ressourcen

Bei der Intensivvorlesung zu Beginn des Semesters wird Wert darauf gelegt, dass kein Dozentenwechsel stattfindet. Die Vorlesung wird seit dem Sommersemester 2000 durchgehend von einem habilitierten Biometriker abgehalten; ihre Inhalte werden über Anwendungsprojekte vor allem aus der Augenheilkunde motiviert und illustriert, da Studierende des ersten klinischen Semesters bereits einen Augenspiegelkurs absolvieren. Die Studierenden erhalten zu Beginn der Veranstaltung ein kostenloses Skript, in welchem die Präsentations-Folien der Vorlesung als Mitschreibehilfe zusammen gestellt sind. Ebenso wird in der ersten Kursstunde ein von einem technischen Assistenten des Instituts erstelltes, eigens auf die Anforderungen im Kurs abgestimmtes Benutzer-Skript zu den wichtigsten Funktionen des SPSS® kostenlos ausgegeben, welches insbesondere bei technischen Fragen als Nachschlagewerk dienen soll. Die Kurse werden von verschiedenen Kursleitern betreut, die zumeist eine mathematische Ausbildung haben; zwei der Dozenten sind im Beratungsbetrieb langjährig erfahrene Ärzte. Bei personellen Engpässen hält mitunter auch ein Dozent zwei Kurse, was auch im Sommersemester 2002 der Fall war. Die Bearbeitung der SPSS-basierten Aufgaben erfolgt in Teams von je zwei Studierenden unter Supervision des jeweiligen Kursleiters und eines technischen Assistenten; somit sind insbesondere auch im Kurs Dozentenwechsel bis auf Krankheits-Bedingte Ausfälle ausgeschlossen. Die Kursleiter können je nach eigener Bedarfseinschätzung eine Einführung zum aktuellen Praktikumsstoff (z.B. Auswertung von Überlebenszeitstudien, Methodenvergleichstudien etc.) geben, ferner sollen sie die Aufgaben der vorherigen Stunde zusammenfassend besprechen und ggf. mit einzelnen PC-Teams auf individuelle Probleme eingehen, wenn die Studierenden die aktuelle Aufgabe bearbeiten. In jedem Fall wird Wert darauf gelegt, dass die Kurse in der Bearbeitung der Aufgaben und der daran aufgehängten anschließenden Bewertung durch den Kursleiter so homogen wie möglich verlaufen.

Teilnehmerbefragung

Im Sommersemester 2002 wurde unter den Studierenden des ersten klinischen Semesters eine Intensivbefragung mit einem zuvor speziell für die Belange der Biometrie konzipierten Evaluationsbogen durchgeführt. Nach Ende des Praktikums wurde dieser Bogen von den Studierenden in 7 Minuten anonym unter Abwesenheit der Dozenten ausgefüllt, die Bögen wurden von einer Promovendin des IMBEI verwaltet, um die Vertraulichkeit der Studierenden zu sichern. Dabei wurden zum Praktikum insgesamt 26 Items in einer vierwertigen Liekert-Skala erhoben (Abbildung 1 [Abb. 1]), welche die Dimensionen "Kommunikation / Didaktik", "Struktur / roter Faden", "inhaltliche Motivation" sowie "Verknüpfung von Vorlesung und Praktikum" beleuchten (Tabelle 1 [Tab. 1]). Aus den resultierenden Einzelangaben wurden Scores gemittelt, welche die obigen Dimensionen in einen Wertebereiche zwischen 1.0 (bestmögliche Bewertung aller Items) bis 4.0 (schlechtestmögliche Bewertung) abbilden. Ferner wurden für Vorlesung und Praktikum jeweils Globalnoten mit Schulnoten-Interpretation (Wertebereich 1 bis 6) für den "Lerneffekt" und das "Verständnis" in Vorlesung bzw. Praktikum erhoben; abschließend wurde ein ausreichender Raum für Freitextkommentare zu Dozenten, Veranstaltungen und Skripten vorgegeben. Neben den 26 Items waren im Fragebogen ferner zwei speziell den Einbezug des SPSS® betreffende Angaben enthalten ("Ich bin mit SPSS gut zurecht gekommen" und "Durch Einbezug der Auswertungssoftware SPSS wurde das Verständnis der Inhalte verstärkt"), welche im Sinne von Confoundern ähnlich wie die Person des Kursleiters zur Adjustierung bei der Bewertung des Praktikums in Abhängigkeit obiger Erfolgskriterien verwendet werden sollten.

Der verwendete Bogen ist eine Erweiterung des am Fachbereich Medizin der Universität Mainz im Rahmen des Projektes "Evaluation der Lehre" entwickelten Instruments, welches seit dem Wintersemester 2000/01 jedes Semester zur internen Qualitätskontrolle eingesetzt wird. Seit dem Sommersemester 2001 ist der Bogen psychometrisch evaluiert mit einer internen Konsistenz von 92% (Guttman's lambda, Sommersemester 2001) bzw. 93% (Wintersemester 2001/02).

Auswertung

Die studentischen Angaben wurden mittels einer SPSS®-Maske erfasst und gemäß ihrem Skalenniveau mittels SPSS® ausgewertet. Bei der Deskription von Einzelangaben wie den 26 Items im Fragebogen werden üblicherweise die beiden positiven und negativen Antwortkategorien jeweils zusammengefasst und mittels absoluter sowie geeigneter relativer Häufigkeiten wiedergegeben; die Verteilungen der Scores zu den oben benannten Dimensionen werden mittels Medianen und Quartilen im Gesamtkollektiv sowie in Subgruppen beschrieben (graphisch entsprechend mittels nonparametrischer Boxplots). Univariate Signifikanzvergleiche wurden im Falle kategorialer Angaben mittels Fisher-Tests, im Falle der Scores mittels Wilcoxon-Tests zum lokalen Niveau 5% durchgeführt. Binäre bzw. binärisierte Angaben wie die Akzeptanz des SPSS® oder der Benotung des Lerneffekts und des Verständnisses in Vorlesung und Praktikum wurden ferner mittels multipler logistischer Regressionsmodelle zu den Scores und möglichen Cofaktoren wie dem Geschlecht der Befragten und bisherigem Kontakt mit einer Dissertation in Bezug gesetzt. Die Regressionsmodelle wurden in einer Vorwärtsselektion angepasst, lokale Signifikanzen zu den Niveaus 5% mittels Likelihood Ratio-Tests bestimmt.


Ergebnisse

Es konnten die Erhebungsbögen von 147 Studierenden ausgewertet werden (Rücklauf 92%). Dabei stuften 24% der Befragten das "Verständnis" im Praktikum mit gut / sehr gut ein, 72% das Verständnis in der Vorlesung; 14% stuften den "Lerneffekt" im Praktikum mit gut / sehr gut ein, 70% den in der Vorlesung.

Tabelle 2 [Tab. 2] zeigt die Antwortverteilung der zentralen Einzelangaben, wobei die positiven Bewertungen "trifft genau / ziemlich zu" zusammengefasst wurden; diese Angaben sind aus Gründen der Vertraulichkeit gegenüber den Mitarbeitern des Instituts für Medizinische Biometrie, Epidemiologie und Informatik nicht nach Praktikumsdozenten stratifiziert. Es fällt auf, dass den Lehrenden durchweg eine gute Kommunikation und Interaktion mit den Studierenden attestiert wird, wie es sich vor allem in den entsprechenden Items der Aspekte "Kommunikation / Didaktik" und "Struktur / Ablauf" wider spiegelt. Die eigentlichen didaktischen Fähigkeiten und vor allem das Potential zur fachlichen Motivation des zu vermittelnden Stoffes werden jedoch mit Anteilen positiver Bewertungen zwischen 14% ("Dozent motiviert für sein Fachgebiet") und 52% ("besseres Verstehen von Statistik in medizinischen Fachzeitschriften") merklich kritischer kommentiert.

Werden alle 7 Praktikumsgruppen gepoolt entlang der den Einzelangaben übergeordneten Aspekte ausgewertet (Abbildung 2 [Abb. 2]), so ergibt sich aus den Praktikums-Bezogenen Items für die Dimension "Kommunikation" ein medianer Score von 1.51 (Interquartilspanne 1.25 - 2.00), für die "Struktur" ein medianer Score von 2.27 (2.03 - 2.78), für die "Verknüpfung von Vorlesung und Praktikum" einer von 2.37 (2.05 - 2.65) und für die "inhaltliche Motivation" von 2.82 (2.34 - 2.97). Zwischen den 7 Kursleitern zeigt sich lediglich bei der Dimension "Struktur" ein signifikanter Unterschied (Kruskal / Wallis p < 0.001) vor allem zu Ungunsten eines der Dozenten mit einer mathematischen Ausbildung.

Speziell bei der Dimension "inhaltliche Motivation" liegen jedoch alle Kursleiter-spezifischen Mediane oberhalb der Skalenmitte 2.50 (Kruskal / Wallis p = 0.218), sodass hier von keiner nennenswerten Abhängigkeit der bei den Studierenden geweckten inhaltlichen Motivation vom Kursleiter ausgegangen werden kann. Werden die zu diesen vier Dimensionen gehörigen Scores im Rahmen einer logistischen Regression den Endpunkten "Lerneffekt gut / sehr gut" sowie "Verständnis gut / sehr gut" des Praktikums gegenübergestellt, so ergibt sich nach Korrektur für Kursleitereffekte eine signifikante Assoziation mit der "inhaltlichen Motivation" nur für das Verständnis im Praktikum (Likelihood Ratio p<0.001), nicht aber für den Lerneffekt (p=0.241). Die entsprechenden Bewertungen der Vorlesung sind nicht signifikant mit der "inhaltlichen Motivation" assoziiert (p=0.637 für das Verständnis und p=0.273 für den Lerneffekt).

Der Anteil Studierender, die "gut mit SPSS zurecht gekommen" sind, variiert in den Kursen zwischen 43% und 88% (gepoolter Anteil 58%). Hierbei zeigt sich kein signifikanter Unterschied zwischen den Geschlechtern (Fisher p=0.205); konkret berichten 62% der weiblichen Studierenden gegenüber 55% der männlichen Studierenden ein "gutes Zurechtkommen mit SPSS".

Unter den Studierenden, welche nach eigener Angabe "gut mit SPSS zurecht gekommen sind", berichten jedoch nur 30% ein gutes / sehr gutes Verständnis des Praktikumsstoffes, 15% einen guten / sehr guten Lerneffekt im Praktikum. Unter den Studierenden, die nach eigener Angabe "nicht gut mit SPSS zurecht gekommen" sind, betragen diese Anteile jeweils 13%. Unter den Studierenden, die "gut mit SPSS zurecht gekommen" sind, attestieren ferner 70% der Vorlesung eine gute / sehr gute Verständlichkeit sowie 73% einen guten / sehr guten Lerneffekt; unter den anderen Studierenden betragen diese Anteile jeweils 66%. Nur für die Dimension "inhaltliche Motivation" zeigt sich beim Vergleich dieser beiden Gruppen Studierender ein signifikanter Unterschied (mediane Scores 2.49 versus 3.08, Likelihood Ratio p<0.001 nach Korrektur für Kursleitereffekte). Abbildung 3 [Abb. 3] zeigt die Verteilungen der Globalscores im Praktikum stratifiziert nach der Akzeptanz des SPSS®, wobei weder für die Struktur des Praktikums (p=0.362), dessen Verknüpfung mit der Vorlesung (p=0.165) noch die Kommunikation und Didaktik (p=0.407) nach Korrektur für Effekte der Kursleiter nennenswerte Tendenzen zugunsten einer positiveren Bewertung des Kurses bei Vorliegen einer Akzeptanz von SPSS® erkennbar werden.

Dieser Eindruck festigt sich bei Auswertung der Angabe, ob "durch Einbezug der Auswertungssoftware SPSS das Verständnis der Inhalte verstärkt" wurde: Lediglich 14% der Befragten geben hier eine in der Tendenz positive Antwort, keiner der Scores ist mit dieser Einschätzung lokal signifikant assoziiert (Likelihood Ratio p-Wert jeweils > 0.10). Die 128 Studierenden, welche dem Einbezug des SPSS keinen nennenswerten Verständnisgewinn attestieren, bewerten ihrerseits ferner das Verständnis im Praktikum nur zu 26% mit gut / sehr gut, während der Vorlesung zu 68% ein gutes / sehr gutes Verständnis attestiert wird. Für den Lerneffekt von Praktikum und Vorlesung zeigen sich mit 11% und 70% die gleichen Tendenzen in sogar noch deutlicherer Form.


Diskussion

Auf der Basis einer studentischen Bewertung sollte für den derzeit an vielen Standorten umgesetzten Einbezug einer Auswertungssoftware (im vorliegenden Falle SPSS®) beurteilt werden, ob sich so eine nennenswerte Motivation oder Motivationssteigerung der Studierenden erzeugen und erkennen lässt. In jedem Fall scheint die für das Fach "Medizinische Biometrie" essentielle "inhaltliche Motivation" durch den Einbezug selbst einer nicht eigens für Studierendenunterricht konzipierten Software gesteigert werden zu können. Das Ausmaß dieser Steigerung scheint jedoch angesichts der vorliegenden "Kundenbefragung" mehr als diskussionswürdig. Die Ergebnisse können auch so interpretiert werden, dass eine Software im Unterricht ihre eigenen (technischen) Probleme einbringen kann und somit eine bestehende - an sich schon begrenzte - Motivation der Studierenden noch um ein Weiteres gesenkt werden kann.

Bedenklich erscheint auch die Tatsache, dass das Praktikum, obwohl für wesentlich mehr Software-Basierte Eigeninitiative der Studierenden konzipiert, merklich schlechter bewertet wird als eine konventionell präsentierte Vorlesung. Verständnis und Lerneffekt scheinen also ebenfalls nur graduell durch den in Mainz praktizierten Einbezug von SPSS® gesteigert worden zu sein, konnten aber in keinem nennenswerten Maße "geweckt" werden. Ein Grund für diese enttäuschende Bilanz kann im Dozenten beruhen, der die Studierenden zur Software-Anwendung im Unterricht anleitet: Hier genügt es nach Freitextkommentaren der Studierenden nicht, in einem realen Datensatz "zwei Geräte, die wir X und Y nennen", zu vergleichen - die klinische Motivation der Anwendungen muss vom Dozenten gerade jetzt besonders instruktiv mitgeliefert werden. Dies scheint nach Ansicht der Autoren bei entsprechender Berücksichtigung gerade die Chance eines Software-Einbezugs der beschriebenen Form zu sein, da dann umfangreiche und vor allem klinisch relevante Fragestellungen bearbeitet und beantwortet werden können. Insbesondere wird so auch die Realität der Arbeit im Rahmen von Auswertungen eigener Dissertationen bereits frühzeitig zumindest demonstriert, in gewissen Grenzen sogar eingeübt. Diese Motivation kann jedoch nur wirksam werden, wenn dieser Bezug zur "Realität eines/r Studierenden" der Medizin hergestellt werden kann - die beste Software und die spannendsten Illustrationen werden zwangsläufig verpuffen, wenn gerade dieses Motivations-Potential durch bekennende Fachdistanz des Kursleiters zur Medizin verschenkt wird. Generell ist in diesem Sinne zu hinterfragen, ob das didaktische Konzept bzw. dessen logistische Umsetzung im Praktikum wirklich ausgereift sind. Gerade für z.B. an mehrjährigen konventionellen "Frontalunterricht" gewohnte Dozenten wird der Umstieg auf die hier beabsichtigte interaktivere und damit auch innovativere Art des Lehrens eine spürbare Anstrengung - eventuell auch einen eigenen Lernbedarf - bewirken, der sich manche Dozenten erst schrittweise bewusst werden. Es sei jedoch auch nicht in Abrede gestellt, dass neben der Erfahrung eines Dozenten mit dieser neu zu erlernenden Art des Unterrichtens auch dessen grundsätzliche Bereitschaft zum Engagement und seine grundlegende Eignung zur Lehre nicht als selbstverständlich vorausgesetzt werden dürfen. Bei einem so großen Dozentenpool, wie er im IMBEI erfreulicherweise verfügbar ist, bestehen zwangsläufig Imbalancen in Motivation der Dozenten, welche schon zu einem gewissen Teil die Defizite in der Motivierbarkeit der Studierenden erklären könnten. Der statistisch signifikante Kursleitereffekt hinsichtlich der Dimension "Struktur und Ablauf" (siehe oben) könnte ein Indiz für diesen Erklärungsansatz sein, spiegelt sich jedoch nicht nennenswert im Score zur Dimension "Motivation" wieder.

Vielmehr zeigen die zumindest moderate technische Akzeptanz des SPSS©, aber vor allem die kritische Bewertung zum Verständnisgewinn durch dessen Einbezug (Anteil positiver Bewertungen 14%, Tabelle 2 [Tab. 2]), dass der Einbezug des SPSS© noch nicht so wirkt wie eigentlich beabsichtigt: Das SPSS© soll eher als Hilfsmittel zur Beantwortung klinisch relevanter Fragen und damit der Vermittlung einer entscheidenden Fachmotivation dienen - derzeit scheinen aber Ausgestaltung der Praktika und Auswahl der dahinter stehenden klinischen Fragenstellungen dieses eigentliche Ziel noch nicht zu gewährleisten. Nach intensiver Rücksprache mit dem Vorlesungsdozenten, dem seit mehreren Semestern in unabhängigen Evaluationen der Vorlesung gerade dieses Ziel im besten Sinne attestiert wird, befindet sich derzeit die Auswahl der im Praktikum zu bearbeitenden klinischen Projekte in intensiver Revision. Im Rahmen der anstehenden Umgestaltungen der Lehre im Fach "Medizinische Biometrie" hin zum Querschnittsfach "Epidemiologie, Medizinische Biometrie und Informatik" sollen neue Projekte von aktueller und zugleich für Studierende des ersten klinischen Semesters auch inhaltlich zu erfassender Relevanz sein: Projekte z.B. aus der Onkologie sind oft trotz ihrer spannenden Aspekte kaum für einen Unterricht in diesem Semester geeignet, da die Studierenden erst ein Jahr später im Fach Chirurgie die entsprechenden klinischen Detailkenntnisse verstehen - so entsteht für die Studierenden ein für viele Dozenten der Biometrie kaum nachvollziehbarer "black box"-Effekt alleine durch die medizinischen Hintergründe der eigentlich zur Motivation gedachten Projekte: Während es für einen Methodiker zur Illustration ausreichen mag, zwei "Medikamente A und B" zu vergleichen, möchte ein angehender Arzt wissen und verstehen können, warum "A" plötzlich eine signifikant höhere Rate unerwünschter Arzneimittelwirkungen als "B" zeigt. An dieser Schwelle der Motivation wird die zur Klärung der Signifikanz notwendige Statistik Nebensache - lakonisch formuliert ein notwendiges Muss, welches mit SPSS© abgearbeitet werden kann. Die Statistik wird nun benutzt, um die wirklich interessierende Fragestellung zu klären. So ist die Biometrie kein Selbstzweck mehr, sondern wird für den Studierenden ein legitimes Mittel zum Zweck (nämlich der Bewertung von Therapien, dem Vergleich von Arzneimitteln, also schlichtweg dem klinischen Wissensgewinn).

Für die Auswahl solcher real (!) motivierender Projekte haben sich klinische Fächer bewährt, deren Grundlagen sehr früh im Studium unterrichtet werden. Der Vorlesungsdozent des IMBEI in Mainz greift hier beispielsweise intensiv auf die Augenheilkunde zurück: Die Phänomenologie und chirurgische Therapie z.B. der senilen Katarakt ist einem Studierenden des ersten klinischen Semesters sehr einfach zu erklären, sodass er sich sofort in die statistisch zu bearbeitende klinische Fragestellung integrieren kann. Auch einfache Projekte aus der Zahnheilkunde sind hier sehr hilfreich: Die meisten Studierenden wissen, wie sich das Verlieren eines dentalen Inlays anfühlt, verspüren also ein vitales Interesse an der Frage, welche Dentalzemente die Haltefestigkeit eines Inlay optimieren - und warum sie dieses tun! Auch hier sollte der Dozent der Biometrie nicht stehen bleiben dem Satz "Der neue Zement ist also signifikant besser als der alte.": Er sollte einige Worte zur Begründung liefern, etwa zur Charakterisierung der neuen Zementzusammensetzung, welche ja die eigentliche Studie motiviert hat. Am besten erfolgt diese Motivation sogar vor Auswertung der klinischen Daten zum neuen und alten Zement, sodass die Biometrie und Statistik von klinischer Motivation und Folgerung eingehüllt werden - letztlich hat die Umhüllung bitterer Medizin mit Schokolade seinerzeit auch zur Erfindung der Praline geführt. Eine sachkompetente klinische Ummantelung der zu vermittelnden biometrischen Inhalte erfordert jedoch eine gewisse Mindestfachkenntnis von Seiten des Biometrikers, die im Vorfeld problemlos im Gespräch mit Klinikern zu den für das Praktikum intendierten Projekten gewonnen werden kann. Nach Erfahrung des Vorlesungsdozenten sind Ansprechpartner der klinischen wie auch der theoretischen Medizin sehr an einer guten und motivierenden biometrischen Ausbildung des medizinischen Nachwuchses interessiert, und investieren dafür nur zu gerne Zeit und Energie bei der Auswahl guter Datensätze und dem klinischen "briefing" des diese verwendenden Biometrikers. Letzterer muss sich dieser Aufgabe jedoch auch stellen, was sowohl Zeit als auch Engagement erfordert - diese Investition scheint sich jedoch angesichts der Bewertung der Vorlesung "Medizinische Biometrie" am IMBEI durchaus zu lohnen und wird derzeit auch von Praktikumsdozenten des IMBEI zunehmend ernst genommen. Speziell die anstehende Umsetzung der Medizinischen Biometrie als Querschnittsfach bietet hier enorme Chancen, da in diesen Querschnittsfächern eben die interdisziplinäre Zusammenarbeit im Unterricht gefördert wird. Bei rechtzeitiger Öffnung im oben beschriebenen Sinne stellen also die nun anstehenden Änderungen im Unterricht der Medizinischen Biometrie eine wirkliche Chance zur Akzeptanzsteigerung dieses Faches dar!

Auch wenn bereits Daten-Basierte Empfehlungen zum Einbezug von Software und elektronischen Lern- / Lehrmedien in den Biometrieunterricht existieren ([3], [4]), scheint das Akzeptanzproblem der Biometrie also durch einen Software-Einbezug alleine also nicht wirklich lösbar zu sein. Der den Stoff und das Praktikum präsentierende Dozent hat gerade in der Medizinischen Biometrie eine nach wie vor zentrale Rolle, da möglicherweise doch nur er im persönlichen Kontakt den Fachbezug und damit auch eine hinreichende Motivation sichern kann (entgegen dem oben berichteten nicht signifikanten Ergebnis bei Vergleich des "Motivations-Scores" zwischen den Kursleitern!): Im Sommersemester 2002 wurde außer der beschriebenen Erhebung im Praktikum auch schon in der Mitte des Semesters mit dem gleichen Fragebogen eine Erhebung in der letzten Vorlesungsstunde durchgeführt. Betrachtet man hier die Verteilungen der Scores zu den Aspekten "Motivation" und "Struktur", so ergeben sich mit Medianen von 1.44 (Interquartilabstand 1.10 - 2.01) bzw. 1.22 (1.15 - 1.80) zumindest beim Aspekt "Motivation" unerwartet positive Bewertungen. Es ist nicht verwunderlich, dass eine im wesentlichen frontal abgehaltene Vorlesung leichter eine gute Bewertung ihrer Struktur erreichen kann als ein stark interaktiv konzipiertes Praktikum. Dass jedoch bei einer Vorlesung, die im Vergleich zum Praktikum trotz der zahlreichen präsentierten und auch in Diskussion mit den Hörern erarbeiteten Anwendungsbeispielen ein "Trockenschwimmen" darstellt, eine so merklich höhere fachliche und inhaltliche Motivation resultiert, ist zumindest unerwartet (siehe oben zu einer möglichen Motivation). Da der Vorlesungsdozent im Sommersemester 2002 keinen Praktikumskurs betreut hat, ist leider im vorliegenden Studiendesign keine intraindividuelle Korrektur für dessen didaktische und persönliche Akzeptanz bei den Studierenden möglich. Werden jedoch solche Faktoren als Erklärung der obigen Diskrepanz zwischen Vorlesung und Praktikum ausgeschlossen (der Kruskal/Wallis-Test zeigt keinen signifikanten Kursleitereffekt im "Motivations-Score"!), müssen Kurs-Spezifika als Ursache diskutiert werden. Auch hier scheint der Kursleiter als eigene Dimension ein nur begrenzt viel versprechender Ansatzpunkt zu sein, da einerseits alle oben beschriebenen multiplen Regressionen an Kursleitereffekte adjustiert waren, andererseits auch selbst zwei parallele Kurse einer Dozentin mit Medianen von 2.68 und 3.03 erkennbar unterschiedliche Bewertungen zur fachlichen Motivation geäußert haben. Da üblicherweise auch gerade in der Humanmedizin Veranstaltungen mit aktivem Einbezug der Studierenden merklich besser bewertet werden als frontal abgehaltene Wissensvermittlungen, muss obige Diskrepanz also eher auf strukturelle Unterschiede zwischen Kurs und Vorlesung zurück geführt werden. Hier ist der Software-Einbezug eine nahe liegende Erklärung, der eigene Probleme technischer Art mit sich bringt, aber wie oben demonstriert, keinen eigenen Verständnisgewinn. Welche dieser spekulativen Erklärungsansätze letztendlich wirklich die Ursache(n) der negativeren Bewertung treffen, kann aus den vorliegenden Daten kaum abgeleitet werden. In jedem Fall sehen die Autoren in den erhaltenen studentischen Kommentaren eine Warnung, dass der Einbezug einer Software zumindest der beschriebenen Art die Akzeptanz-Probleme des Faches Medizinische Biometrie kaum wird lösen können.

Kritisch zu sehen ist bei der vorliegenden Evaluation jedoch, dass diese den Aspekt der Software nur indirekt abbildet (die Intention der Erhebung im Rahmen einer Dissertation zum Themenbereich "interventionelles Prozessmanagement" war eine andere), und vor allem hier auch keine wirkliche "Lernsoftware" betrachtet wurde. Weder das Hilfe-System von SPSS® noch die vom technischen Assistenten des Kurses eigens erstellte SPSS®-Anleitung sind vergleichbar mit der Dokumentation und didaktischen Anleitung, welche eine eigens zum Selbstunterricht oder zur Eigenvertiefung konzipierte Lernsoftware üblicherweise bietet. Dennoch wäre nach Ansicht der Autoren zumindest bei der für die Medizinische Biometrie essentiellen "Motivation" ein positiveres Ergebnis zu erwarten gewesen - der klinische Fachbezug dürfte im hier bewerteten Unterrichtskonzept höher sein als in diversen derzeit in Erstellung befindlichen oder bereits verfügbaren Lernprogrammen, die zum Teil doch sehr methodisch orientierte Hintergründe und Inhalte aufweisen. Auch wenn also die Intention und die Natur der hier eingesetzten Software nicht der sonst bei Lernsystemen intendierten entspricht, scheinen die Ergebnisse hinsichtlich der Motivation alleine durch den Software-Bezug durchaus auf andere Systeme extrapolierbar.

Ein weiterer nahe liegender Schwachpunkt der hier beschriebenen Erhebung ist deren zwangsläufig einarmiges Design: Um wirklich Effekte des Software-Einbezugs im Sinne einer "pädagogischen Intervention" messen zu können, wäre eine randomisierte Kontrollgruppe von Studierenden einzubeziehen, welche unter gleichen Voraussetzungen nach der Vorlesung ein Praktikum ohne Software-Einbezug absolvieren muss. Diese Aufteilung eines Semesters ist jedoch alleine schon aus dem rechtlichen Blickwinkel eines Studiendekans kaum denkbar und auch organisatorisch indiskutabel. Eine leichte Tendenz dieses Vergleiches "mit und ohne Software-Einbezug" lässt sich jedoch durch den Vergleich der Befragung nach Ende des Praktikums ("mit Software") mit der vorherigen nach Ende der Vorlesung ("ohne") ableiten, welche eindeutig zu Ungunsten der Software ausgefallen ist. Werden die Benotungen von Verständnis und Lerneffekt der Vorlesung zu diesen beiden Zeitpunkten verglichen, so zeigt sich, dass sich beide Vorlesungs-Benotungen sogar noch in der zweiten Befragung nach Praktikumsende signifikant verbessert haben.

Abschließend sollte die Eignung der hier betrachteten Endpunkte kritisch hinterfragt werden: Diese bilden in erster Linie die Zufriedenheit und nicht den wirklichen (Lern-) Erfolg eines Praktikums ab (entsprechend der Erfassung der Patientenzufriedenheit mit einer Therapie statt der Frage nach erfolgreicher Heilung durch dieselbe). Es kann nur gemutmaßt werden, wie weit die oben beschriebenen Benotungen von Verständnis und Lerneffekt wirklich den Effekt der "Intervention" Software-Einbezug auf Verständnis und Lerneffekt widerspiegeln. Auch hier zeigt sich nur ein indirekter Hinweis auf die Berechtigung der obigen Folgerungen durch Vergleich der Befragung nach Vorlesungsende mit der nach Praktikumsende: In beiden Befragungen wurden mit der Motivation einer Prozesskontrolle zusätzliche Angaben zum eigenen Leistungsstand erhoben wie "Ich kann nun Aussagen wie << das relative Risiko ist statistisch signifikant (p=0.021) um 24% erhöht >> in Fachzeitschriften sachgerecht interpretieren". In der Befragung zu Ende der Vorlesung wurde dies von 76% der Befragten positiv beantwortet, nach Ende des Praktikums nur noch von 52%! Ob diese Änderung, die sich auch in drei weiteren ähnlichen Fragen in vergleichbarer Tendenz abzeichnet, eher auf einen Gewinn an Einsicht zur eigenen Unkenntnis oder - weniger philosophisch - auf einen kontraproduktiven Effekt des Software-Einbezugs und seiner technischen Hürden zurück geführt werden muss, kann hier kaum sachgerecht beantwortet werden.

Für derzeit im Bereich des "electronic learning" engagierte Arbeitsgruppen sollte aber aus den gemachten Beobachtungen in jedem Fall die Empfehlung abgeleitet werden, den Blickwinkel des Anwenders so früh und konstruktiv wie möglich einzubinden - wie im Marketing entscheidet auch hier der Kunde, welches Angebot er langfristig annehmen wird, und nicht der Anbieter.


Anmerkung

Kernergebnisse dieser Arbeit entstammen der Dissertationsschrift von Frau Dr. med. dent. Ulrike Weiler (eingereicht zur Promotion zum Dr. med. dent. am Fachbereich Medizin der Johannes Gutenberg-Universität Mainz) und wurden als Vortrag präsentiert im Rahmen der 48. Jahrestagung der Deutschen Gesellschaft für Medizinische Biometrie, Epidemiologie und Informatik (GMDS, September 2003 in Münster).


Literatur

1.
Hans A. Entwicklung, Einführung und Perspektiven eines Beurteilungssystems für Lehrleistungen am Fachbereich Medizin der Johannes Gutenberg-Universität Mainz. Dissertation am Fachbereich Medizin der Universität Mainz. Mainz: Universität Mainz, Fachbereich Medizin; 2001.
2.
Weiler U. Qualitätsmanagement durch Prozessevaluation in der Ausbildung von Studierenden der Medizin am Beispiel des Faches "Medizinische Biometrie". Dissertation am Fachbereich Medizin der Universität Mainz. Mainz: Universität Mainz, Fachbereich Medizin; 2002.
3.
Krummenauer F. Software im Biometrie-Unterricht. Med Ausbild. 1998;15:83-87.
4.
Krummenauer F, Hommel G, Michaelis J. Unterstützung des Biomathematik-Unterrichts mit SAS: Ein Erfahrungsbericht. Inform Biom Epidemiol Med Biol. 1998;29:153-164.