gms | German Medical Science

50. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds)
12. Jahrestagung der Deutschen Arbeitsgemeinschaft für Epidemiologie (dae)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie
Deutsche Arbeitsgemeinschaft für Epidemiologie

12. bis 15.09.2005, Freiburg im Breisgau

Itemgewichtung mittels logistischer Regression oder neuronaler Netzwerk-Simulation - was verbessert die diagnostische Qualität eines Screening-Instrumentes zur mentalen Gesundheit?

Meeting Abstract

Search Medline for

  • Michael Erhart - Robert Koch-Institut, Berlin
  • Ulrike Ravens-Sieberer - Robert Koch-Institut, Berlin
  • Europäische KIDSCREEN-Gruppe

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie. Deutsche Arbeitsgemeinschaft für Epidemiologie. 50. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds), 12. Jahrestagung der Deutschen Arbeitsgemeinschaft für Epidemiologie. Freiburg im Breisgau, 12.-15.09.2005. Düsseldorf, Köln: German Medical Science; 2005. Doc05gmds468

The electronic version of this article is the complete one and can be found online at: http://www.egms.de/en/meetings/gmds2005/05gmds229.shtml

Published: September 8, 2005

© 2005 Erhart et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution License (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en). You are free: to Share – to copy, distribute and transmit the work, provided the original author and source are credited.


Outline

Text

Einleitung und Fragestellung

Sofern ein diagnostischer Screening-Test aus wenigen Items besteht können zur Verbesserung der diagnostischen Qualität die Itemwerte mit unterschiedlicher Gewichtung zu einem Index kombiniert werden, vorausgesetzt die Gewichtungsfaktoren werden an hinreichend großen Stichproben ermittelt [1]. Der KIDSCREEN-10-Index zum subjektiven Wohlbefinden ist ein neuer europaweit einsetzbarer kurzer Fragebogen zur psychischen Gesundheit von Kindern und Jugendlichen [2]. Die 10 Items zu affektiven, kognitiven, psychosozialen und motivationalen Aspekten werden zu einem Index der mentalen Gesundheit aufsummiert. Der KIDSCREEN-Index soll zum Screening von psychischen Auffälligkeiten in großen internationalen epidemiologischen Gesundheitsstudien verwendet werden.

Diese Studie vergleicht Gewichtungsprozeduren basierend auf logistischen Regressionen und neuronalen Netzwerk-Simulationen mit der traditionellen Gleichgewichtung. Geprüft wird ob der KIDSCREEN-Index in der Selbstauskunftsversion ein diagnostisch brauchbares Screening psychischer Erkrankungen ermöglicht und welcher Gewichtungs-Algorithmus zu den besten Resultaten hinsichtlich der Sensitivität und der Spezifität gegenüber psychischen Störungen führt.

Material und Methoden

Datengrundlage der Untersuchung sind die im Rahmen der Europaweiten KIDSCREEN Feldstudie erhobenen Daten (n=2920) von deutschen und österreichischen Kindern und Jugendlichen im Alter von 8 – 18 Jahren. Das Vorliegen einer psychischen Störung wurde durch den Strengths and Difficulties Questionnaire [3] in der Selbst- und Elternauskunft sowie Elternangaben über psychische Störungs-Diagnosen festgestellt. Insgesamt 197 Befragte wiesen demnach eine psychische Störung auf. Untersucht wurde, wie gut der KIDSCREEN-Index in der Selbstauskunftsversion zwischen diesen psychisch auffälligen- sowie den unauffälligen Kindern und Jugendlichen zu unterscheiden vermag. Unter Verwendung einer Zufallsauswahl von 80% der Befragten (Trainingsdatensatz) wurden die 5-stufigen Itemwerte einmal direkt und einmal als dummy-kodierte Indikatorvariablen in logistische Regressionsanalysen (SPSS 12.0) zur Vorhersage einer psychischen Störung aufgenommen und die resultierenden Regressionskoeffizienten für zwei Skalierungsalternativen des KIDSCREEN verwendet.

Außerdem wurden die Itemwerte in einem künstlichen neuronalen Netzwerk (NEURAL CONNECTION 2.1) zur Vorhersage psychischer Auffälligkeiten eingegeben. Wir trainierten ein aus 10 Eingabeneuronen, 3 verdeckten Neuronen und einem Ausgabeneuron bestehendes Multi-Layer-Perceptron mit hyperbolischer-Tangens-Aktivierungsfunktion [4]. Zur Vermeidung von Überlernen wurde ein bayesianischer Backpropagation Algorithmus verwendet [5]. Die resultierenden Werte der Ausgabeeinheit dienten als Testwerte. Danach wurden die dummy-kodierten Itemwerte in ein 40 Eingabeneuronen, 6 verdeckten Neuronen und ein Ausgabeneuron umfassendes Netzwerk eingegeben und die Werte der Ausgabeeinheit als weitere Auswertungsmöglichkeit des KIDSCREEN verwendet.

Die diagnostische Qualität des ungewichteten KIDSCREEN Summenwertes, sowie der verschiedenen Gewichtungsprozeduren wurde über die mittels Sensitivität und 1 - Spezifität hinsichtlich psychischen Störungen ermittelte Fläche unter der Receiver Operating Characteristic (ROC) Kurve [6] bestimmt. Statistisch signifikante Unterschiede zwischen den ROC’s wurden berechnet (STATA 8.2). Die anhand des Trainingsdatensatzes entwickelten Gewichtungsprozeduren wurden anschließend an den verbleibenden 20% der Befragten (Testdatensatz) kreuzvalidiert. Die Reliabilität des KIDSCREEN Summenwerte wurde über Cronbach’s Alpha ermittelt.

Ergebnisse

Der Summenwert des KIDSCREEN ermöglicht mit einer Fläche unter der ROC-Kurve von 0.76 (Trainingsdaten) beziehungsweise 0.77 (Testdaten) nach den Konventionen von [7] eine “akzeptable“ Unterscheidung zwischen unauffälligen- und psychisch auffälligen Kindern und Jugendlichen. Die Reliabilität des Summenwertes betrug nach Cronbach’s Alpha 0.81. Die Itemgewichtung durch die logistischen Regressionskoeffizienten sowie die Gewichtungsfaktoren der neuronalen Netzwerk-Simulation führten im Trainingsdatensatz zu einer statistisch signifikanten Verbesserung der diagnostischen Qualität des KIDSCREEN (Fläche unter der ROC-Kurve = 0.78 bzw. 0.80 bei dummy-Kodierung). Im Testdatensatz ergaben sich dagegen keine statistisch signifikanten Unterschiede. Eine Begutachtung der logistischen Regressionskoeffizienten und der Gewichte des trainierten neuronalen Netzwerkes ergab unter Berücksichtigung der Iteminhalte keine theoretisch plausiblen Werte.

In einem weiteren Schritt wurden soziodemografische Informationen (<12 / >= 12 Jahre, Geschlecht und Nationalität) als Kovariaten und Interaktionsterme mit den KIDSCREEN Variablen in weitere logistische Regressionsanalysen und neuronale Netzwerk-Simulationen einbezogen. Unter Hinzunehmen dieser Informationen verbesserte sich unter beiden mathematischen Ansätzen im Trainingsdatensatz statistisch signifikant die diagnostische Qualität des KIDSCREEN Summenwertes (Fläche unter der ROC-Kurve = 0.80) und der 10 Itemwerte (Fläche unter der ROC-Kurve = 0.83). Im Testdatensatz vergrößerte lediglich die neuronale Netzwerk-Simulation mit dem Summenwert und den soziodemografischen Variablen bzw. den Interaktionstermen statistisch signifikant die Fläche unter der ROC-Kurve auf 0.80. Dieser Wert, der nach den Konventionen von [7] als “ausgezeichnete“ Diskriminationsfähigkeit bewertet werden kann, wurde auch von der entsprechenden logistischen Regressionsprozedur erreicht.

In Subgruppenanalysen zeigten sich je nach Alter und Geschlecht geringe aber statistisch signifikante Unterschiede in der Fläche unter der ROC-Kurve.

Diskussion

Der KIDSCREEN-10-Index ermöglicht ein diagnostisch brauchbares Screening psychischer Erkrankungen bei deutschen und österreichischen Kindern und Jugendlichen. Unter Berücksichtigung von Alters-, Geschlechts- und Nationalitäts- Unterschieden ermöglicht der Summenwert des KIDSCREEN-10 sogar eine über die aktuelle Stichprobe hinaus generalisierbare “ausgezeichnete“ [7] Diskrimination zwischen unauffälligen- und psychisch auffälligen Kindern und Jugendlichen. Das auf der Selbstauskunft der Befragten basierende KIDSCREEN-Instrument ist in der Anwendung ökonomisch, der Summenwert weist eine hohe Reliabilität auf.

Weder die auf logistischen Regressionen- noch die auf neuronalen Netzwerk-Simulationen basierenden komplexeren Item-Gewichtungs-Prozeduren führen zu einer generellen Verbesserung der Sensitivität und Spezifität bezüglich psychischen Störungen, sondern bewirken im ungünstigsten Falle lediglich eine Anpassung an stichprobenbedingte Besonderheiten [1]. Hierauf deuten auch die theoretisch nicht plausibel erklärbaren Regressions-Koeffizienten bzw. Netzwerk-Gewichte hin.

Die Ergebnisse belegen die Wichtigkeit der Berücksichtigung von Alters-, Geschlechts- und Nationalitäts- Unterschieden bei der Diagnostik psychischer Erkrankungen sowie die Notwendigkeit einer Kreuzvalidierung bei der Entwicklung und Testung diagnostischer Prozeduren.

Aufgrund der vorliegenden Resultate wird zum Screening psychischer Auffälligkeiten die Verwendung des ungewichteten KIDSCREEN-Summenwertes in Verbindung mit Alters-, Geschlechts- und Länderzugehörigkeits- Angaben empfohlen. Das KIDSCREEN Instrument wird in verschiedenen europaweiten Studien zur Gesundheit von Kindern und Jugendlichen als Screening-Instrument eingesetzt. Weitere differenziertere Überprüfungen seiner diagnostischen Qualität sowie verschiedener Grenzwerte sind geplant.


Literatur

1.
Nunnally, JC, Bernstein, IH. Psychometric Theory (3rd edition). New York: McGraw-Hill; 1994
2.
Ravens-Sieberer U, Gosch A, Abel T, Auquier P, Bellach BM, Bruil J, Dür W, Power M, Rajmil L and the European KIDSCREEN Group Quality of Life in children and adolescents - a European public health perspective. Soz Präventivmed 2001; 46: 297-302
3.
Goodman R. The extended version of the Strengths and Difficulties Questionnaire as a guide to child psychiatric caseness and consequent burden. Child Psychol Psychiat 1999; 40: 791-801
4.
Rumelhart DE, McClelland JL. Hrsg. Foundations, volume 1 of Parallel Distributed Processing: Explorations in the Microstructure of Cognition. Cambridge, MA: MIT Press; 1986
5.
Buntine WL, Weigend AS. Bayesian Back-Propagation. Complex Systems 1991; 5: 603-643
6.
Hanley JA, McNeil BJ. The meaning and use of the area under the Receiver Operating Characteristic (ROC) curve. Radiology 1982; 143: 29-36
7.
Hosmer DW, Lemeshow, S. Applied logistic regression (2nd edition). New York: John Wiley & Sons; 2000