gms | German Medical Science

53. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie

15. bis 18.09.2008, Stuttgart

Signalanalyse von Polysomnographien unter Verwendung einer Gridinfrastruktur

Meeting Abstract

  • Dagmar Krefting - Charite - Universitätsmedizin Berlin, Berlin, Deutschland
  • Sebastian Canisius - Universitätsklinikum Gießen und Marburg, Fachbereich der Philipps Universität Marburg, Marburg, Deutschland
  • Kathrin Peter - Zuse Institut Berlin, Berlin, Deutschland
  • Thomas Tolxdorff - Charite - Universitätsmedizin Berlin, Berlin, Deutschland
  • Thomas Penzel - Charite - Universitätsmedizin Berlin, Berlin, Deutschland

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie. 53. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds). Stuttgart, 15.-19.09.2008. Düsseldorf: German Medical Science GMS Publishing House; 2008. DocMI8-4

The electronic version of this article is the complete one and can be found online at: http://www.egms.de/en/meetings/gmds2008/08gmds142.shtml

Published: September 10, 2008

© 2008 Krefting et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution License (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en). You are free: to Share – to copy, distribute and transmit the work, provided the original author and source are credited.


Outline

Text

Einleitung und Fragestellung

Forschung und Diagnostik in der Schlafmedizin beruht oft auf der Analyse von multimodalen Biosignalaufzeichnungen wie EEG, EKG und EMG über die gesamte Schlafphase des Probanden oder des Patienten, den sogenannten Polysomnograpien. Die Bereitstellung und automatische Analyse von Polysomnographien insbesondere von großen Schlafstudien kann durch die Verwendung eines Daten- und Computinggrids stark vereinfacht und beschleunigt werden [1]. Der Datenbestand der SIESTA-Studie [2] sowie Dienste zur Datenanalyse werden im MediGRID zur Verfügung gestellt. Über den Metadatenkatalog des Griddatenmanagementsystems (SRB) können aus dem Bestand Daten nach Geschlecht, Alter, Krankheitsbild und weiteren Faktoren ausgewählt werden. Die Analyse der Daten erfolgt unter Verwendung eines Workflowmanagers parallelisiert auf den zur Verfügung stehenden Gridresourcen. Dabei werden ausgewählte Zwischenergebnisse im Grid gespeichert, um die Rechen- und Transferzeiten bei zukünftigen Studien weiter zu verringern. Die Entwicklung eines applikationsspezifischen Gridportlets ermöglicht den standortunabhängigen und nutzerfreundlichen Zugang zu den Daten und implementierten Algorithmen.

Material und Methoden

Zur automatisierten Analyse von Biosignaldaten stellen verschiedene Projekte freie Software zur Verfügung (z.B. Physiotoolkit http://www.physionet.org/physiotools/, Biosignaltoolbox (http://biosig.sourceforge.net/), EEGlab). Die Analyse von Polysomnographien mit Messdauern von etwa 8 Stunden und bis zu 20 Kanälen stellt jedoch oft Speicher- und Rechenkapazitätsanforderungen. Die Verwendung von Desktoprechnern führt zu langen Rechenzeiten oder Speicherüberlastung , die umständlich durch Rekonfiguration des Systems oder manuelle Sequezialisierung der Zeitreihen gelöst werden müssen. Die Tools sind unter Linux-Systemen entwickelt worden, so dass für die Verwendung unter Microsoft Windows – dem Standardbetriebsystem in Kliniken, ein relativ großer Installationsaufwand betrieben werden, bzw. lizenzpflichtige Software (z.B. Matlab) installiert sein muss. Zudem sind die einzelnen Softwarepakete auf EKG, bzw. EEG-Analyse spezialisiert, wodurch die Verknüpfung der verschiedenen Signale sowie die Einbindung der Hypnogramme, die Messung der Schlafstadien, selbst geleistet werden muss. MediGRID, welches das Gridprojekt für die Lebenswissenschaften der D-Grid Initiative des BMBF ist, bietet hier durch seine Infrastruktur ein großes Potential zur Lösung der genannten Probleme. MediGRID hat Zugang zu mehreren Linuxclustern an fünf verschiedenen Standorten in Deutschland mit ca. 1500 CPUs, sowie mehrere TByte Speicherplatz. Die gewünschten Daten und die einzelnen Algorithmen werden über das Workflowsystem miteinander verbunden. Erweiterungen wie Schnittstellenanpassungen sowie eigene Analysesoftware können für den Nutzer transparent integriert werden. Der webbasierte Nutzerzugang über das Portal ermöglicht die Datenauswahl und Verwendung der Analysetools, ohne sich um den physikalischen Speicherort, die Betriebsystemkompatibilität oder Rechenresourcen kümmern zu müssen. Obwohl zum jetzigen Zeitpunkt keine reidentifizierbaren Patientendaten im Grid gespeichert oder verarbeitet werden, sind die derzeitig zur Verfügung stehenden Sicherheitsmechanismen aktiviert. Der Zugang zum Grid erfolgt zertifikatsbasiert und über die Virtuelle Organisationsstruktur des D-Grid. Sämtliche Datenkommunikation und Ausführung im Grid wird single-sign-on authentifiziert und autorisiert. Die Zugriffsrechteverwaltung des SRB erlaubt jedem Nutzer, seine Daten für andere versteckt oder für eine Untergruppe les- und/oder schreibbar zu machen. Das Workflowmanagementsystem bietet die Kapazität für a priori und a posteriori Tracking, so dass der Datenfluss und die Verarbeitungsschritte sowohl gesteuert als auch im Nachhinein verfolgt werden können.

Ergebnisse

Ausgangsbasis sind die Datensätze des europäischen SIESTA -Kompetenznetzes für Schlafanalyse und -forschung. Sie umfassen jeweils neben weiteren Untersuchungen Polysomnographien und Hypnogramme über 2 Nächte von ca. 200 Probanden und 100 Patienten mit verschiedenen Schlafstörungen [2]. Die Messungen wurden in der SRB-Instanz des MediGrid unter einem Gruppenaccount gespeichert.

Die Gruppenmitgliedschaft wird über das VO-Management des D-Grid verwaltet. Vordefinierte Auswahlkriterien für Kohortenanalysen wurden als nutzerdefinierte Attribute in die Metadatenverwaltung des SRB integriert (siehe Tabelle 1 [Tab. 1]).

Zurzeit ist die Analyse der EKG-Signale, aufgeschlüsselt nach Schlafphasen, implementiert. Der Workflow umfasst zum einen die Bestimmung und QRS-Analyse des EKG-Signals aus den Polysomnographien. Verwendet werden die Programme und Libraries des Physiotoolkits (PTK), die auf den Gridnodes installiert wurden. Da PTK ein proprietäres Datenformat verwendet, müssen dazu die edf-Daten umgewandelt werden, der Vorteil ist jedoch, dass nur das EKG gespeichert wird, das Datenvolumen etwa 10% der gesamten Polysomnographie beträgt. Um für nachfolgende Analysen die Transferzeiten zu den Gridnodes zu minimieren, wird der umgewandelte Datensatz ebenfalls im SRB gespeichert, und im Metadatenkatalog registiert. Anschließend wird die statistische Analyse der Herzfrequenz bezüglich der anhand eines Hypnogramms ermittelten Schlafphasen durchgeführt. Die Algorithmen sind in Matlab implementiert. Die matlab-skripte werden auf einer Linuxarchitektur kompiliert und können so auf den Gridnodes lizenzfrei zur Verfügung gestellt werden. Das Ergebnis der einzelnen Messungen wird ebenfalls im SRB abgelegt. Im letzten Schritt folgt die Zusammenführung und statistische Auswertung der Ergebnisse der ausgewählten Probanden/Patientengruppe.

Diskussion und Ausblick

Die Verwendung von Grid-Infrastrukturen bietet eine ideale Arbeitsplattform zur kollaborativen Verwaltung und Analyse von Polysomnographien in der Schlafforschung. Die gezeigte Implementation ist nur eine Beispielanwendung. Das Methodenspektrum kann durch den modularen Aufbau und die Workflowbeschreibung kontinuierlich erweitert und angepasst werden. Nächste Schritte sind die Implementierung von nichtlinearen Analysen für die Herzfrequenz, sowie die Analyse weiterer Parameter, wie die Dauer des QRS Komplexes. Ein Nachteil ist, dass die Implementation neuer Softwaredienste zur Zeit noch manuell erfolgen muss, insbesondere die Anbindung an den Workflowmanager sowie die Integration in das Webportal. Eine große Chance bietet aber die leichte Erweiterbarkeit des Datenbestandes, da interessierte Ärzte und Schlafforscher weitere Polysomnographien hochladen können.

Danksagung

Diese Arbeit ist Teil des MediGRID Projektes des BMBF, Förderkennzeichen 01AK803A-H.


Literatur

1.
Canisius S, et al. Sleep Medicine as a Scenario for Medical Grid Application. Studies in Health Technology and Informatics, Volume 126, 2007
2.
Klösch G, et al. The SIESTA project polygraphic and clinical database. IEEE Eng Med Biol Mag. 2001; 20(3):51-7
3.
Alt M, et al. Using High Level Petri-Nets for Describing and Analysing Hierarchical Grid Workflows. In: Proceedings of the CoreGRID Integration Workshop 2005