gms | German Medical Science

GMS Medizinische Informatik, Biometrie und Epidemiologie

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS)

ISSN 1860-9171

Diagostische Profile bei akuten Bauchschmerzen mit multinominaler logistischer Regression

Diagnostic profiles of acute abdominal pain with multinomial logistic regression

Originalarbeit

  • author Pablo E. Verde - Coordination Centre for Clinical Trials, Heinrich-Heine- University, Düsseldorf, Germany
  • author Franz Decker - Coordination Centre for Clinical Trials, Heinrich-Heine- University, Düsseldorf, Germany
  • author Qin Yang - Coordination Centre for Clinical Trials, Heinrich-Heine- University, Düsseldorf, Germany
  • author Claus Franke - Surgical Clinic, Krankenhaus Benrath, Kliniken der Landeshauptstadt Düsseldorf gGmbH, Düsseldorf, Germany
  • corresponding author Christian Ohmann - Coordination Centre for Clinical Trials, Heinrich-Heine- University, Düsseldorf, Germany

GMS Med Inform Biom Epidemiol 2007;3(2):Doc11

The electronic version of this article is the complete one and can be found online at: http://www.egms.de/en/journals/mibe/2007-3/mibe000059.shtml

Published: July 17, 2007

© 2007 Verde et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution License (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en). You are free: to Share – to copy, distribute and transmit the work, provided the original author and source are credited.


Zusammenfassung

Ziel: Exemplarische Anwendung der multinominalen logistischen Regression zur Unterstützung der Diagnosestellung bei akuten Bauchschmerzen, einem diagnostischen Problem mit vielen Differentialdiagnosen.

Methodik: Grundlage der Untersuchung bildete eine prospektive Datenbank von 2280 Patienten mit akuten Bauschmerzen, charakterisiert durch 87 Variablen der Anamnese und klinischen Untersuchung und 12 Differentialdiagnosen. Assoziationen zwischen Einzelparametern der Anamnese und klinischen Untersuchung und der Diagnose der akuten Bauchschmerzen wurden mit Hilfe der multinominalen logistischen Regression untersucht und bewertet.

Ergebnisse: Beispielhaft werden die Ergebnisse für die Variable „Abwehrspannung“ (Ausprägung: nein, lokalisiert, generalisiert) dargestellt. Ein statistisch signifikanter Zusammenhang (p<0.001) wurde zwischen der Ausprägung „generalisierte Abwehrspannung“ und den Diagnosen Appendizitis, Ileus, Pankreatitis, Ulkusperforation, multiple und andere Diagnosen und der Ausprägung „lokalisierte Abwehrspannung“ und den Diagnosen Appendizitis, Divertikulitis, Gallenwegserkrankung und Ulkusperforation ermittelt. Durch Zusammenfassung statistisch signifikanter Variablenausprägungen wird beispielhaft für die Diagnose „akute Appendizitis“ ein diagnostisches Profil erstellt.

Schlussfolgerungen: Im Vergleich zu alternativen Modellen (z.B. Unabhängigkeits-Bayes Theorem, loglineares Modell) besitzt die multinominale logistische Regression für die Diagnoseunterstützung bei mehr als zwei Diagnosen Vorteile, vorausgesetzt potentielle Fallstricke werden bei der Anwendung beachtet (z.B. α-Fehler, Interpretation des Odds ratios).

Schlüsselwörter: multinominale logistische Regression, akute Bauchschmerzen, Diagnose

Abstract

Purpose: Application of multinomial logistic regression for diagnostic support of acute abdominal pain, a diagnostic problem with many differential diagnoses.

Methods: The analysis is based on a prospective data base with 2280 patients with acute abdominal pain, characterized by 87 variables from history and clinical examination and 12 differential diagnoses. Associations between single variables from history and clinical examination and the final diagnoses were investigated with multinomial logistic regression.

Results: Exemplarily, the results are presented for the variable rigidity. A statistical significant association was observed for generalized rigidity and the diagnoses appendicitis, bowel obstruction, pancreatitis, perforated ulcer, multiple and other diagnoses and for localized rigidity and appendicitis, diverticulitis, biliary disease and perforated ulcer. Diagnostic profiles were generated by summarizing the statistical significant associations. As an example the diagnostic profile of acute appendicitis is presented.

Conclusions: Compared to alternative approaches (e.g. independent Bayes, loglinear model) there are advantages for multinomial logistic regression to support complex differential diagnostic problems, provided potential traps are avoided (e.g. α-error, interpretation of odds ratio).

Keywords: multinomial logistic regression, acute abdominal pain, diagnosis


Einleitung

Zur Charakterisierung von Einzelparametern bei der Diagnosestellung werden standardmäßig Sensitivität, Spezifität und positiver sowie negativer prädiktiver Wert herangezogen, sofern es sich um eine dichotome Variable und ein dichotomes Zielkriterium handelt (z.B. Diagnose ja, nein). Möchte man den Einfluss einer oder mehrerer erklärender Variablen auf ein dichotomes Zielkriterium untersuchen, wird in der Regel die (multiple) lineare logistische Regression empfohlen, bei der die Wahrscheinlichkeit für eine Diagnose unter der Voraussetzung einer bestimmten Variablenkombination geschätzt wird. Die multinominale logistische Regression ist eine Verallgemeinerung der binären logistischen Regression und erlaubt die Analyse eines nominalskalierten Zielkriteriums mit mehr als zwei Ausprägungen. Sie bietet sich daher in besonderer Weise für diagnostische und prognostische Probleme mit mehr als zwei Ausprägungen des Zielkriteriums an. Belegt wird dies durch aktuelle Anwendungen in der Literatur (z.B. [1], [2], [3]).

Die Diagnosestellung bei akuten Bauchschmerzen stellt auch heute noch ein schwieriges diagnostisches Problem dar [4]. Nach wie vor werden beträchtliche Fehlerraten beobachtet, die sich unter anderem in hohen negativen Appendektomie- und Laparotomieraten widerspiegeln [5]. Bildgebende Verfahren führen häufig nur bei vorselektioniertem Krankengut oder in der Hand von Spezialisten zu guten Ergebnissen [6], [7]. Auch Laboruntersuchungen sind nur bedingt hilfreich [8]. Entscheidend für die Diagnosestellung ist nach wie vor eine genaue Anamnese- und klinische Befunderhebung, bei der viele Parameter erhoben und bewertet werden, um aus zahlreichen möglichen Diagnosen die wahrscheinlichste herauszufinden [9], [10], [11]. Eine systematische Bewertung von Parametern wurde bisher hauptsächlich für einzelne Diagnosen (z.B. Appendicitis: ja, nein) durchgeführt und hat hier zur Entwicklung von Scores geführt [12] oder erfolgte im Rahmen einer computerunterstützten Diagnose mit dem Bayes-Theorem unter der meist nicht erfüllten Voraussetzung der bedingten Unabhängigkeit [13], [14]. Gegenstand der vorliegenden Untersuchung war es daher, die Bedeutung einzelner Parameter für die Diagnosestellung bei akuten Bauchschmerzen zu untersuchen mit dem Ziel, durch Anwendung einer multinominalen logistischen Regression signifikante Zusammenhänge zwischen Ausprägungen einzelner Parameter und individuellen Diagnosen zu ermitteln und auf dieser Basis diagnostische Profile zu erstellen.


Patienten und Methoden

Datensatz

Der in der Publikation untersuchte Datensatz wurde im Rahmen einer prospektiven multizentrischen Beobachtungsstudie erstellt, die im Rahmen des MEDWIS-Programms durchgeführt wurde (Projekt: MEDWIS A 70). An der Studie beteiligten sich 10 Chirurgische Kliniken in der Bundesrepublik Deutschland und eine in Österreich. Die Studienleitung und das Studienzentrum waren in Düsseldorf angesiedelt.

In die Studie aufgenommen wurden konsekutiv alle Patienten, bei denen akute Bauchschmerzen innerhalb einer Woche vor Vorstellung im Krankenhaus aufgetreten waren. Nicht berücksichtigt wurden erneute Krankenhausaufnahmen wegen akuter Bauchschmerzen, postoperativ aufgetretene akute Bauchschmerzen, Bauchschmerzen bei bekanntem Trauma, Hernien, bei denen die Schmerzsymptomatik nicht im Vordergrund stand und Kinder unter sechs Jahren. Weiterhin wurden Patienten ausgeschlossen, bei denen mehr als 10% fehlende Daten vorlagen, keine zeitnahe Computerdokumentation durchgeführt wurde und eine definitive Entlassungsdiagnose nicht gestellt wurde. Die Datensammlung wurde im Zeitraum vom 1.10.1994 bis 31.8.1995 durchgeführt. Die im Rahmen der Studie erstellte Datenbank umfasst 65 Variablen der Anamnese und 22 Variablen der klinischen Untersuchung. Durch eine Expertengruppe wurden basierend auf Vorarbeiten in der Literatur alle untersuchten Parameter von Anamnese und klinischem Befund und die Differentialdiagnosen definiert und standardisiert [10]. Die in der Untersuchung betrachteten Diagnosen sind aus klinischer Sicht wichtig, da sie unterschiedlliche therapeutische Ansätze bedingen, von sofortiger Operation, über medikamentöse Therapie bis hin zur Beobachtung und Entlassung. Die Variablen sind ausführlich in den Publikationen von Franke et al. [7], [10] beschrieben. Bei der Entlassungsdiagnose wurde differenziert nach den 10 Hauptdiagnosen. Darüber hinaus wurden in jeweils einer Gruppe Patienten mit multiplen Diagnosen und mit anderen Diagnosen zusammengefasst (Tabelle 1 [Tab. 1]). Die Diagnosessicherheit wurde anhand eines Schlüssels spezifiziert (telefonisch/postalische Befragung, nur Anamnese/Klinische Untersuchung, Spezialuntersuchungen intraoperativ, histopathologisch/pathologisch). Bei ambulanten Patienten oder Verlegungen war eine Nachverfolgung notwendig (30 Tage nach Erstbehandlung). Anamnese und klinischer Befund wurden vom behandelnden Arzt zeitnah mit Hilfe eines komfortablen Computerprogrammes in der Klinik dokumentiert. Die Dokumentation der Entlassungsdiagnose erfolgte bei Entlassung durch den Studienarzt ebenfalls mit Hilfe des Computerprogrammes.

Statistische Methodik

In der Studie wurden Zusammenhänge zwischen Parametern der Anamnese bzw. klinischer Untersuchung und der Diagnose der akuten Bauchschmerzen mit Hilfe der multinominalen logistischen Regression untersucht [15]. Die ist eine Verallgemeinerung der binären logistischen Regression, welche die Analyse von mehreren nominalen kategorischen Zielkriterien erlaubt. Im Fall eines nominalen kategorischen Zielkriteriums Y mit J Ausprägungen ist für J–1 Gruppen die bedingte Wahrscheinlichkeit in Abhängigkeit von den erklärenden Variablen X 1 ,....,X m zu modellieren. Die Modellformulierung erfolgt über J–1 Logit-Gleichungen, wobei im Nenner der Wahrscheinlichkeitsquotienten jeweils die Referenzkategorie J auftritt (Falls nur eine erklärende Variable X):

Formel 1

Dies ist eine naheliegende Generalisierung des binären logistischen Modells, das als Spezialfall (mit J=2) enthalten ist. Hierbei bezeichnet β j , den unbekannt, zu schätzenden Regressionskoeffizienten, der den Einfluss der erklärenden Variable auf das Zielkriterium quantifiziert. Zur Schätzung der logistischen Regressionskoeffizienten wird die Maximum-Likelihood-Methode verwendet. Im Falle einer binären erklärenden Variablen, deren Ausprägungen mit 1 (ja) und 0 (nein) kodiert sind, wird nur ein Regressionskoeffizient β 1 für die Ausprägung 1, geschätzt, die Ausprägung 0 dient als Referenzkategorie. Im Falle einer multinominalen erklärenden Variablen, deren Ausprägungen mit 1, 2, ....., K kodiert sind, werden K-1 Regressionskoeffizienten β 1 , β 2, ... β k-1 für die Ausprägungen 1 bis K-1 geschätzt, wobei die Ausprägung K die Referenzkategorie darstellt. Um zu untersuchen, ob ein Regressionskoeffizient signifikant von Null verschieden ist, wird der Wald-Test verwendet.

Für die Analyse wurden die Diagnose „unspezifische Bauchschmerzen (USB)“ und eine Ausprägung der erklärenden Variablen (in der Regel Ausprägung: keine, nein, normal oder unauffällig usw.) als Referenzkategorie definiert. Für jede Erklärungsvariable wurde eine separate multinominale logistische Regression durchgeführt und das Signifikanzniveau gemäß drei Stufen (p<0,05, p<0,01, p<0,001) ermittelt. Für die Ermittlung von diagnostischen Profilen wurden nur Signifikanzen mit p<0,001 berücksichtigt, d.h. Variablen, die mit keiner Diagnose assoziiert sind (p>=0,001) wurden von der weiteren Betrachtung ausgeschlossen. Patienten mit einem unbekannten Wert einer erklärenden Variable wurden von der Auswertung ausgeschlossen.

Die Auswertungen wurden mit Hilfe des Programms der Multinominalen Logistischen Regression der statistischen Software SPSS 12.0 für Windows durchgeführt [16]. Kategoriale Einflussvariablen mit mehr als zwei Ausprägungen wurden automatisch in Dummy-Variablen konvertiert.


Ergebnisse

Insgesamt wurden 2280 Patienten in die Studie eingebracht. Die Entlassungsdiagnose wurde in 43,2% histopathologisch oder intraoperativ und in 39,3% aufgrund von Spezialuntersuchungen erhoben. Bei den verbleibenden Patienten wurde in 6,5% telefonisch/postalisch nachgefragt, bei 11% standen lediglich Informationen aus Anamnese und klinischer Untersuchung zur Verfügung. Häufigste akute chirurgische Abdominalerkrankung war die akute Appendizitis. Bei 565 Patienten (25%) ließ sich keine eindeutige Diagnose festmachen, d.h. die Ursache für die Abdominalbeschwerden blieb unklar; die Diagnose wurde gemäß Standardisierung als „unspezifische Bauchschmerzen“ eingestuft. Die Verteilung der Diagnosen ist in Tabelle 1 [Tab. 1] dargestellt.

Beispielhaft für die Analyse aller Parameter wird die Variable Abwehrspannung als Teil der klinischen Untersuchung betrachtet. Die Variable hat drei Ausprägungen: generalisiert, lokalisiert und keine Abwehrspannung. In einer Kontingenztafel ist die Verteilung dieser Variablen abhängig von den Abschlussdiagnosen dargestellt (Tabelle 2 [Tab. 2]). Mit Hilfe der multinominalen logistischen Regression ergeben sich unter Berücksichtigung der Referenzkategorien „keine Abwehrspannung“ und der Diagnose „unspezifische Bauchschmerzen“ 2 x 11 Koeffizienten mit zugehörigen statistischen Signifikanzen (Tabelle 3 [Tab. 3]). Klassifiziert man diese Signifikanzen gemäß Signifikanzniveau, so erhält man die Darstellung in Tabelle 2 [Tab. 2]. Es ergibt sich demnach ein statistischer Zusammenhang zwischen der Ausprägung generalisierter Abwehrspannung und den Diagnosen Appendizitis, Ileus, Pankreatitis, Ulkusperforation, multiple Diagnosen und andere Diagnosen und zwischen der Ausprägung lokalisierter Abwehrspannung und den Diagnosen Appendizitis, Divertikulitis, Gallenwegserkrankung und Ulkusperforation (p<0,001). Von den 87 untersuchten Variablen wiesen nur 64 einen statistisch signifikanten Zusammenhang mit mindestens einer Diagnose auf (siehe Tabelle 4 [Tab. 4]).

Betrachtet man alle statistisch signifikanten Assoziationen zwischen einer Variablenausprägung und einer Diagnose mit p<0,001, so erhält man ein diagnostisches Profil. Dieses diagnostische Profil ist in Tabelle 5 [Tab. 5] für die akute Appendizitis dargestellt. Für die akute Appendizitis ergibt sich ein charakteristisches Schmerzprofil mit bewegungsabhängigen und gleichbleibendem schweren Schmerzverlauf über eine Dauer von 12 bis 48 Stunden, vornehmlich im rechten unteren Quadranten. Weiterhin werden gehäuft Begleitsymptome wie Übelkeit, Erbrechen und Appetitlosigkeit festgestellt. Dem weitgehenden Ausschluss einer Appendizitis dient die Erfassung einer Appendektomie vor Krankenhausaufnahme. In der klinischen Untersuchung hat der Druckschmerz (generalisiert, rechter unterer Quadrant, untere Hälfte sowie stark) neben der eingeschränkten Bauchdeckenbewegung, der Abwehrspannung (generalisiert, lokalisiert) und dem Loslassschmerz (beidseitig, ipsilateral, kontrolateral) eine hohe diagnostische Bedeutung. Zudem findet sich bei Appendizitis gehäuft ein positives Murphyzeichen, ein rechter Rektalschmerz und eine normale Darmgeräuschintensität. Aus den Ergebnissen der multinominalen logistischen Regression lässt sich für jede Diagnose ein zusammengefasstes diagnostisches Profil erstellen; dieses wird beispielhaft in Tabelle 6 [Tab. 6] für die akute Appendizitis präsentiert. Das diagnostische Profil beschreibt die für eine bestimmte Diagnose im Vergleich zur Referenzdiagnose charakterisierenden Variablen mit Ausprägungen.


Diskussion

In der Studie wurde ein multinominales logistisches Modell angewendet mit dem Ziel Assoziationen zwischen einzelnen Variablen und mehreren Diagnosen in einem explorativen Ansatz zu untersuchen. Der Vorteil des gewählten Modells für das untersuchte diagnostische Problem liegt auf verschiedenen Ebenen. Logistische Regressionsmodelle finden in der Medizin breite Anwendung und sind in verschiedenen Statistikpaketen implementiert (z.B. SAS, SPSS, R). Außer der Annahme eines linearen Zusammenhangs zwischen dem unabhängigen Parameter und dem Logarithmus des Quotienten der Wahrscheinlichkeiten werden keine weiteren Annahmen gemacht. Um festzustellen, ob die Wahrscheinlichkeiten von einem bestimmten Parameter abhängen, können Wald-Tests durchgeführt werden. Ein signifikantes Resultat bedeutet, dass der Koeffizient β von 0 verschieden ist. Mehrere Diagnosen können parallel untersucht werden, wobei prinzipiell die Möglichkeit besteht auch Zusammenhänge zwischen Variablen und Diagnosen mit geringer Häufigkeit festzustellen. Beispielhaft wurde dies in der Arbeit für den Zusammenhang zwischen der Variable Abwehrspannung und die Diagnosen Ulkusperforation und Pankreatitis herausgearbeitet. Alternative Modelle sind das Unabhängigkeits-Bayes-Theorem, das loglineare Modell und diverse Bayes-Ansätze. Das Unabhängigkeits-Bayes-Theorem setzt bei Betrachtung mehrerer Einflussvariablen die Unabhängigkeit der bedingten Wahrscheinlichkeiten (Likelihoods) voraus, eine Voraussetzung, die in der Praxis in der Regel nicht erfüllt ist [17]. Dies führt zu nicht kalibrierten Wahrscheinlichkeiten. Außerdem gibt es in diesem Modell keine Möglichkeit statistisch signifikante Zusammenhänge zu ermitteln. Das loglineare Modell stellt einen Spezialfall der verallgemeinerten linearen Modelle für Poisson-verteilte Daten dar [15]. Im loglinearen Modell wird kein Unterschied zwischen abhängigen und unabhängigen Variablen gemacht. Nur Assoziationen zwischen Variablen können ermittelt werden. Darüber hinaus bestehen Voraussetzungen an Fallzahl und die Größe der erwarteten Häufigkeiten, die in dem speziellen vorliegenden Datensatz nicht erfüllt sind. Aus diesem Grunde wurde das loglineare Modell nicht angewendet. Für sehr große Kontingenztafeln, wie in unserem Fall, werden auch alternative empirische oder volle Bayes- Ansätze empfohlen [18], [19]. Eine weitere Alternative könnte darin bestehen, separat für jede Diagnose (im Vergleich zu einer Referenzdiagnose) eine einfache logistische Regression durchzuführen und für die verschiedenen Modelle moderne Kriterien für multiples Testen anzuwenden [20], [21]. Solche Ansätze sind derzeit Gegenstand von Untersuchungen unserer Arbeitsgruppe.

In der Analyse wurde auf die gleichzeitige Untersuchung mehrerer Einflussparameter, d.h. eine multivariate Analyse verzichtet. Die Begründung hierfür ergibt sich aus der großen Anzahl von Einflussvariablen (m=87) mit einer großen Anzahl zu schätzender Koeffizienten (n=1620). Demgegenüber stehen nur 2280 Beobachtungen, was weniger als zwei Beobachtungen pro Koeffizient entspricht. Hieraus ergibt sich ein Problem der Stabilität der geschätzten Parameter, daher wurde in einem pragmatischen Ansatz pro Einflussvariable ein separates Modell angepasst und keine multivariate Analyse durchgeführt. Um das Diagnoseproblem zu vereinfachen wurden Variablen, die mit keiner Diagnose assoziiert sind (p>=0,001), von der Betrachtung ausgeschlossen.

Ein wesentliches Problem in der Untersuchung stellt die multiple Signifikanztestung oder der α-Fehler dar. Bei einer Variablen mit zwei Ausprägungen ergeben sich 11 Koeffizienten, bei Parametern mit vielen Ausprägungen, wie z.B. Druckschmerz, 132 Koeffizienten und betrachtet man alle Einflussfaktoren 1620 Koeffizienten. Mit dieser hohen Dimensionalität des Modells ist die Testung einer einfachen Nullhypothese H0: β1=...β1620 problematisch und die klassische Kontrolle des α-Fehlers verliert ihre Bedeutung. Unsere Analyse ist primär explorativ, wobei die Wahl des Signifikanzniveaus von 0,001 konservativ angesetzt war und einen einfachen Ansatz darstellte, um Scheinassoziationen zwischen Einflussvariablen und Diagnosen zu vermeiden. Anstelle des von uns gewählten Ansatzes über statistisch signifikante Koeffizienten werden in wissenschaftlichen Anwendungen alternative Prozeduren, wie z.B. Akaike Information Criteria (AIC) oder Bayesian Information Criteria (BIC) empfohlen [22], [23]. Leider sind diese Prozeduren für multinominale logistische Regression nicht in Standard- Statistikpaketen implementiert (z.B. SPSS, SAS), so dass sie in unserer Studie für die Selektion von Parametern nicht angewendet wurden. Im Appendix ist der Zusammenhang zwischen AIC, BIC und dem Vorgehen über fixe p-Werte dargestellt.

In der Literatur wird häufig – vor allen Dingen bei prognostischen Problemen – das Odds ratio als quantitatives Maß des Zusammenhangs präsentiert. Quantitative Zusammenhänge waren nicht Gegenstand der vorliegenden Untersuchung. Gegenstand war demgegenüber die Ermittlung von Assoziationen bestimmter Ausprägungen von Einflussgrößen und spezifischen Diagnosen. Hierzu wurde die Methode der statistischen Signifikanztestung herangezogen. Allerdings muss in diesem Zusammenhang auf das Problem der nicht eindeutigen Interpretierbarkeit der geschätzten Koeffizienten bei multinominaler logistischer Regression hingewiesen werden [24].

Die in klinischen Lehrbüchern oder Publikationen dargestellten diagnostischen Profile basieren in der Regel auf Experteneinschätzungen oder deskriptiven Auswertungen von Datenbanken. Mit dem Verfahren der multinominalen logistischen Regression besteht die Möglichkeit diesbezüglich objektivere Grundlagen zu erarbeiten, indem große und qualitativ hochwertige Datenbanken analysiert werden. Interessant wäre in diesem Zusammenhang ein Vergleich diagnostischer Profile, abgeleitet aus unterschiedlichen Datenbanken, sowie ein Vergleich mit Expertenmeinungen. Der in dieser Untersuchung beispielhaft herausgearbeitete Zusammenhang zwischen dem Parameter Abwehrspannung und einzelnen Diagnosen kann auch klinisch bestätigt werden. Eine konkrete Anwendung der Methode im Sinne einer computerunterstützen Diagnose mit Schätzung von Wahrscheinlichkeiten für Diagnosen erscheint nicht sinnvoll vor dem Hintergrund der eingeschränkten Stabilität des Modells bei multivariater Anwendung mit vielen Einflussgrößen. Die Ableitung von Klassifikationsalgorithmen aus den diagnostischen Profilen war nicht Gegenstand der Arbeit. Prinzipiell wäre dies möglich, hierzu bedarf es jedoch weiterer Forschung. Anstelle direkt anwendbarer Diagnosealgorithmen oder Scores wird ein Ansatz präsentiert mit dem diagnostische Profile abgeleitet werden können. Anwendungsbereiche werden vor allen Dingen im Bereich Aus-, Fort- und Weiterbildung gesehen (z.B. Lehrbücher, Studentenunterricht, spezifische Weiterbildung). Problematisch ist sicherlich die Definition der diagnostischen Referenzkategorie, da hiervon die Ergebnisse der Schätzungen abhängen. Im Falle der akuten Bauchschmerzen bietet sich diesbezüglich die Kategorie „Unspezifische Bauchschmerzen“ an, da in diesem Fall von einer nicht zu behandelnden Erkrankung ausgegangen wird. Ein weiteres Problem des in dieser Untersuchung gewählten Ansatzes liegt in dem teilweise eingeschränkten Nutzen diagnostischer Profile basierend auf statistischen Signifikanzen für die Differentialdiagnose. Sind für eine Variablenausprägung mehrere Koeffizienten statistisch signifikant (z.B. „eingeschränkte Bauchdeckenbewegung“ signifikant für 8 Diagnosen), so kann die jeweilige Diagnose zwar zur Referenzdiagnose „unspezifische Bauchschmerzen“ aber die Diagnosen untereinander nicht differenziert werden. Hierzu bedarf es zusätzlicher quantitativer Information, etwa in Form von Wahrscheinlichkeiten für die jeweiligen Diagnosen.


Anmerkung

Interessenkonflikte

Keine angegeben.

Danksagung

Die Datensammlung im Rahmen der Studie wurde durch eine Förderung des Bundesministeriums für Bildung und Forschung (MEDWIS- Projekt A70) unterstützt. Die Autoren danken allen Mitgliedern der Studiengruppe „Akute Bauchschmerzen“, die an diesem Projekt beteiligt waren (siehe Franke et al. [7]).


Appendix

Zusammenhang zwischen einigen klassischen Kritererien zur Modellselektion

Jedes Kriterium zur Modellselektion kann als Konstruktion von Plausibilitätsintervallen für Parameter interpretiert werden [25], [26]. Ein Parameter wird dann aus dem Modell ausgeschlossen, wenn der Wert im Intervall enthalten ist. Für p Parameter in einem Modell werden diese Intervalle definiert, indem die normalisierten Likelihood Regionen folgendermaßen kalbiriert werden:

Ln>=kp,

wobei Ln der normalisierte Likelihood (0<=Ln<=1) und k einen Plausibilitätslevel (0<=k<=1) für einen Parameter in dem Modell darstellt. Große Werte von k entsprechen schmalen Likelihood Regionen. Diese tendieren dazu Modelle mit einer großen Zahl von Parametern zu selektieren, während durch kleinere Werte von k sparsamere Modelle erzeugt werden. Zwei populäre Selektionskriterien für Modelle sind z.B. AIC und BIC, mit k(AIC)=1/e and k(BIC)=1/√n. Diese Formeln zeigen, dass BIC dazu neigt Modelle mit weniger Parametern als AIC zu selektieren.

Wenn in unserem Fall das Selektionskriterium dahingehend definiert wird, nur solche Variablen im Modell zu belassen, bei denen ein klassischer Chi-Quadrat Test signifikant zum Signifikanzniveau α ist, dann gilt

k( α)=exp(-X2 (1-α,1)/2),

wobei X2 (1-α,1) das 1-α Quantil der Chi-Quadratverteilung mit einem Freiheitsgrad ist. In diesem Fall wird kein schrittweises Vorgehen als Selektionsprozedur für das Modell definiert. Dies bedeutet, dass k(α) in gleicher Weise als Term konstant bleibt wie 1/e und 1/√n in AIC und BIC.

In unserem Datensatz mit n=2280 und bei einem α=0,001 ergibt sich k (AIC) =0,3678 > k (BIC) =0,020498 > k (0,001) =0,00445. Dies zeigt, dass letzteres Vorgehen wesentlich konservativer ist als BIC und AIC. Die Prozedur ist konservativ in dem Sinne, dass ein Modell mit einer kleineren Anzahl von Parametern selektiert wird.


Literatur

1.
Violante FS, Fiori M, Fiorentini C, Risi A, Garagnani G, Bonfiglioli R, Mattioli S. Associations of psychosocial and individual factors with three different categories of back disorder among nursing staff. J Occup Health. 2004;46(2):100-8.
2.
Smith MD, Russell A, Hodges PW. Disorders of breathing and continence have a stronger association with back pain than obesity and physical activity. Aust J Physiother. 2006;52(1):11-6.
3.
Schildge J, Klar B. Sarkoidose der Lunge -- klinische und bronchoskopische Befunde in Abhangigkeit vom radiologischen Stadium. Pneumologie. 2005;59(9):582-7.
4.
Zielke A. Appendicitis. Moderne Diagnostik. Chirurg 2002;73:782-90.
5.
Kraemer M, Ohmann C, Leppert R, Yang Q. Macroscopic assessment of the appendix at diagnostic laparoscopy is reliable. Surg Endosc. 2000;14(7):625-33.
6.
Doria AS, Moineddin R, Kellenberger CJ, Epelman M, Beyene J, Schuh S, Babyn PS, Dick PT. US or CT for Diagnosis of Appendicitis in Children and Adults? A Meta-Analysis. Radiology. 2006;241(1):83-94.
7.
Franke C, Böhner H, Yang Q, Ohmann C, Röher HD. Ultrasonography for diagnosis of acute appendicitis: results of a prospective multicenter trial. Acute Abdominal Pain Study Group. World J Surg. 1999;23(2):141-6.
8.
Hallan S, Asberg A. The accuracy of C-reactive protein in diagnosing acute appendicitis-a meta-analysis. Scand J Clin Lab Invest. 1997;57(5):373-80.
9.
Körner H, Sondenaa K, Soreide JA, Andersen E, Nysted A, Lende TH. Structured data collection improves the diagnosis of acute appendicitis. Br J Surg. 1998;85(3):341-4.
10.
Franke C, Verreet P, Ohmann C, Böhner H; Klinische Expertengruppe Akute Bauchschmerzen. Klinische Standardisierung bei akuten Bauchschmerzen. Langenbecks Arch Chir. 1996;381(2):65-74.
11.
Böhner H, Yang Q, Franke C, Ohmann C; Studiengruppe Akute Bauchschmerzen. Bedeutung anamnesischer Angaben und klinischer Befunde für die Diagnose der akuten Appendicitis. Z Gastroenterol. 1994;32:579-83.
12.
Ohmann C, Yang Q, Franke C; Abdominal Pain Study Group. Diagnostic scores for acute appendicitis. Eur J Surg. 1995;161(4):273-81.
13.
Adams ID, Chan M, Clifford PC, Cooke WM, Dallos V, de Dombal FT, Edwards MH, Hancock DM, Hewett DJ, McIntyre N, Somerville PG, Spiegelhalter DJ, Wellwood J, Wilson DH. Computer aided diagnosis of acute abdominal pain: a multicentre study. Br Med J . 1986;293(6550):800-4.
14.
Wellwood J, Johannessen S, Spiegelhalter DJ. How does computer-aided diagnosis improve the management of acute abdominal pain? Ann R Coll Surg Engl. 1992;74(1):40-6.
15.
McCullagh P, Nelder JA. Generalized Linear Models. 2nd ed. London: Chapman & Hall; 1989.
16.
SPSS Regression Models 12.0. SPSS 12.0 for Windows. Copyright 2003 by SPSS Inc.
17.
Sahai H. Teaching Bayes' Theorem using examples in medical diagnosis. Teaching Mathematics and its applications 1992;11:175-79.
18.
Law GR, Cox DR, Machonochie NE, Simpson J, Roman E, Carpenter LM. Large tables. Biostatistics. 2001;2(2):163-71.
19.
Congdon P. Bayesian Models for Categorical Data. John Wiley & Sons, Ltd.; 2005.
20.
Efron, B. Large-Scale Simultaneous Hypothesis Testing: the choice of a null hypothesis. JASA 2004;99:96-104.
21.
Efron, B. Local False Discovery Rates. 2005. Available: http://www-stat.stanford.edu/~brad/papers/. External link
22.
Verde PE, Geracitano LA, Amado LL, Rosa CE, Bianchini A, Monserrat JM. Application of public-domain statistical analysis software for evaluation and comparison of comet assay data. Mutat Res. 2006;604(1-2):71-82.
23.
Burnham KP, Anderson DR. Model Selection and Multimodel Inference: A practical Information - Theoretic Approach. 2nd ed. New York: Springer; 2002.
24.
Allison PD. Logistic regression using the SAS system. Theory and Application. SAS Institute Inc. Cary, NC, USA; 2001.
25.
Lindsey JK. Relationships among sample size, model selection and likelihood regions, and scientifically important differences. The Statistician 1999;48 Part 3:401-11.
26.
Lindsey JK. On the construction and comparison of statistical models for scientific discovery. 1999. Available: http://popgen.unimaas.nl/~jlindsey/manuscripts.html. External link