gms | German Medical Science

50. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds)
12. Jahrestagung der Deutschen Arbeitsgemeinschaft für Epidemiologie (dae)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie
Deutsche Arbeitsgemeinschaft für Epidemiologie

12. bis 15.09.2005, Freiburg im Breisgau

Rough Set basiertes Verfahren zur Auswahl von EEG-Signalparametern für das Narkosemonitoring

Meeting Abstract

  • Michael Ningler - Klinikum rechts der Isar der TU-München, München
  • Gudrun Stockmanns - Universität Duisburg-Essen, Campus Duisburg, Duisburg
  • Gerhard Schneider - Klinikum rechts der Isar der TU-München, München
  • Eberhard F. Kochs - Klinikum rechts der Isar der TU-München, München

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie. Deutsche Arbeitsgemeinschaft für Epidemiologie. 50. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds), 12. Jahrestagung der Deutschen Arbeitsgemeinschaft für Epidemiologie. Freiburg im Breisgau, 12.-15.09.2005. Düsseldorf, Köln: German Medical Science; 2005. Doc05gmds499

Die elektronische Version dieses Artikels ist vollständig und ist verfügbar unter: http://www.egms.de/de/meetings/gmds2005/05gmds377.shtml

Veröffentlicht: 8. September 2005

© 2005 Ningler et al.
Dieser Artikel ist ein Open Access-Artikel und steht unter den Creative Commons Lizenzbedingungen (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.de). Er darf vervielfältigt, verbreitet und öffentlich zugänglich gemacht werden, vorausgesetzt dass Autor und Quelle genannt werden.


Gliederung

Text

Einleitung und Fragestellung

Methoden der Rough Set Theorie [1] werden – meist im Rahmen eines Data Mining Prozesses – zur automatischen Klassifikation von Daten eingesetzt. Diese Methoden finden häufig Anwendung in medizinischen Fragestellungen, z.B. in Entscheidungsunterstützungssystemen zur Erstellung von Diagnosen.

Ein Aufgabengebiet der Rough Set Theorie (RST) besteht in einer Auswahl für die Klassifikation geeigneter Attribute, die im Falle der Signalanalyse in Form von Signalparametern vorliegen. Ziel dabei ist eine ausreichend gute Klassifikation mit einer möglichst geringen Anzahl von Attributen. Es wird ein modifiziertes Verfahren vorgestellt, das eine effektive Reduktion der Attributmenge bei verrauschten Daten ermöglichen soll. Am Beispiel eines Datensatzes basierend auf perioperativ abgeleiteten EEG-Signalen, bei denen eine Zuordnung der Patientenzustände „wach“ und „bewusstlos“ vorliegt, wird der Einfluss des Verfahrens auf die Effektivität der Attributreduktion untersucht.

Material und Methoden

Im Folgenden werden die grundlegenden Begriffe der RST an einem Beispiel erläutert. Die RST behandelt Objekte (z.B. EEG-Abschnitte), deren Eigenschaften durch eine Menge von Attributen (z.B. mittlere Frequenz, maximale Amplitude, etc.) beschrieben werden und die einer bestimmten Entscheidung (z.B. „wach“, „bewusstlos“) zugeordnet sind. Tab.1 [Tab. 1] zeigt eine Entscheidungstabelle, in der die Attribute (A1, A2, A3) und die Entscheidung (E) in den Spalten und die Objekte (1-8) in den Zeilen angeordnet sind.

Die RST erlaubt die adäquate Bearbeitung einer bestimmten Form inkonsistenter Daten. Die Inkonsistenz besteht darin, dass die Objekte zwar verschiedenen Entscheidungen zugeordnet sind, durch die Attribute jedoch nicht unterschieden werden können, da die Information zu grobkörnig vorliegt. In Tab.1 [Tab. 1] sind z.B. die Objekte 2, 3, 4 durch die Attribute A1, A2, A3 ununterscheidbar, jedoch unterschiedlichen Entscheidungen zugeordnet. Daher können die vorliegenden Entscheidungen nicht eindeutig aus den Attributen abgeleitet werden. Dies ist lediglich für die Objekte 1, 7 und 8 möglich. Die Attributmenge {A1, A3} genügt zur eindeutigen Klassifikation dieser Objekte und wird als relatives Redukt bezeichnet. Im Allgemeinen existieren für eine Entscheidungstabelle verschiedene relative Redukte mit unterschiedlichen Anzahlen von Attributen. Die Redukte mit der kleinsten Attributzahl werden als minimale Redukte bezeichnet und sind für die Bildung einfacher Klassifikatoren von besonderem Interesse.

Tab. 1 [Tab. 1] verdeutlicht, dass u.U. nur ein geringer Anteil der Objekte eindeutig einer bestimmten Entscheidung zugeordnet werden kann. Dies ist möglicherweise durch Störungen der Daten in Form von Rauschen bedingt. Um ein solches Rauschen angemessen zu berücksichtigen, wurde das Variable Precision Rough Set Modell (VPRSM) eingeführt [2], das einen festgelegten Anteil fehlklassifizierter Objekte toleriert.

Im VPRSM wird zunächst ein maximal erlaubter Anteil fehlklassifizierter Objekte festgelegt, der als erlaubte Fehlklassifikationsrate (ß) bezeichnet wird. Die ununterscheidbaren Objekte werden, sofern die Fehlklassifikationsrate kleiner ß ist, der Entscheidung zugeordnet, die innerhalb dieser Objekte am häufigsten vorhanden ist. Im Beispiel von Tab. 1 [Tab. 1] können mit ß=0,35 die ununterscheidbaren Objekte 2, 3, 4 mehrheitlich der Entscheidung E=1 zugeordnet werden, wobei Objekt 4 fehlklassifiziert wird. Die Fehlklassifikationsrate ist 1/3 und damit kleiner als ß. Die Objekte 5 und 6 können unabhängig von der Wahl von ß keiner Entscheidung zugeordnet werden, da keine Mehrheitsentscheidung existiert. Ordnet man dem Objekt 4 die „neue“ Entscheidung zu, so findet man als relatives Redukt die Attributmenge {A1, A2}.

Bei der hier vorgestellten Modifikation des VPRSM hingegen wird zunächst auf die Neuzuordnung der Entscheidung verzichtet. Vielmehr wird zuerst eine Attributkombination gewählt und für diese die Anzahl aller Objekte ermittelt, die im Rahmen der erlaubten Fehlklassifikationsrate ß einer Entscheidung zugeordnet werden können. Ist diese Anzahl gleich (oder größer) der Anzahl von Objekten, die bei Betrachtung aller Attribute eindeutig zugeordnet werden kann, so wird die untersuchte Attributkombination im Rahmen dieses Verfahrens als relatives Redukt definiert. Nach dieser Definition sind für die Wahl ß=0,35 die Attribute A1 und A2 jeweils ein relatives Redukt. A1 unterscheidet die Objekte 1 bis 6 von den Objekten 7 und 8. Die erste Objektmenge wird der Entscheidung E=1 zugeordnet mit einer Fehlklassifikationsrate von 1/3. A2 ordnet die Objekte 1 bis 4 der Entscheidung E=1, die Objekte 5 bis 8 E=2 zu. Dies zeigt, dass in Abhängigkeit von der Wahl des relativen Reduktes die Objekte 5 und 6 unterschiedlichen Entscheidungen zugeordnet werden. Für das Beispiel von Tab. 1 [Tab. 1] gilt, dass die Anzahl der zur Klassifikation benötigten Attribute geringer ist und damit die Attributreduktion effektiver als im ursprünglichen VPRSM erfolgt.

Das hier vorgestellte Verfahren des VPRSM wurde auf einen Datensatz angewandt, der auf EEG-Signalen basiert [3], die perioperativ an wachen und bewusstlosen Patienten abgeleitet wurden. Aus 475 Signalabschnitten wurden mittels Signalanalyse 17 Parameter berechnet, welche die Attribute in einer Entscheidungstabelle darstellen. Die Entscheidung wird durch den Patientenzustand „wach“ bei 224 Objekten bzw. „bewusstlos“ bei 251 Objekten repräsentiert.

Ergebnisse

Die Berechnung der relativen Redukte erfolgte bei Variation von ß. Tab.2 [Tab. 2] zeigt die Ergebnisse der Attributreduktion.

Im ursprünglichen VPRSM bleibt für unterschiedliche Werte von ß die Anzahl der Attribute der minimalen Redukte konstant. Beim modifizierten VPRSM hingegen kann die Anzahl der Attribute so reduziert werden, dass ein einziges Attribut zur Klassifikation ausreicht. Dies ist jedoch nur bei ß >=0,3, einer relativ hohen Fehlklassifikationsrate, möglich.

Diskussion

Im Vergleich zum ursprünglichen Modell erlaubt die vorgestellte Modifikation des VPRSMs eine effektivere Reduktion der für eine Klassifikationsaufgabe benötigten Attribute. Im vorgestellten Anwendungsbeispiel kann die Anzahl der Attribute zwar von sechs auf eins verringert werden, jedoch erst bei einer relativ großen erlaubten Fehlklassifikationsrate (ß>=0,30).

Beim Vorliegen stark verrauschter Daten ist die Wahl eines großen Wertes für ß jedoch angemessen, insbesondere um eine zu starke Anpassung des Klassifikators an das Rauschen (Overfitting) zu verhindern. Beim modifizierten VRPSM kann der Anwender entscheiden, ob er einen großen Anteil fehlklassifizierter Objekte zu Gunsten eines einfachen und allgemeingültigen Klassifikators tolerieren kann.


Literatur

1.
Pawlak Z. Rough Sets, Theoretical Aspects of Reasoning about Data. Dordrecht: Kluwer Academic Publishers; 1991
2.
Ziarko W. Variable Precision Rough Set Model. J Comput Syst Sci 1993; 44(1): 39-59
3.
Ningler M, Stockmanns G, Schneider G, Dressler O, Kochs EF. Anwendung der Rough Set Theorie zur Unterscheidung von wach- und Narkose-EEG. Biomed Tech 2003; 48 Erg.1: 258-259