gms | German Medical Science

49. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds)
19. Jahrestagung der Schweizerischen Gesellschaft für Medizinische Informatik (SGMI)
Jahrestagung 2004 des Arbeitskreises Medizinische Informatik (ÖAKMI)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie
Schweizerische Gesellschaft für Medizinische Informatik (SGMI)

26. bis 30.09.2004, Innsbruck/Tirol

Halbautomatische Normalisierung bei der Überführung von Studiendaten in eine CDISC-kompatible Struktur

Meeting Abstract (gmds2004)

Search Medline for

  • presenting/speaker Irmela Stamm - Koordinierungszentrum für Klinische Studien, Heidelberg, Deutschland
  • corresponding author Johannes Hüsing - Koordinierungszentrum für Klinische Studien, Heidelberg, Deutschland

Kooperative Versorgung - Vernetzte Forschung - Ubiquitäre Information. 49. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds), 19. Jahrestagung der Schweizerischen Gesellschaft für Medizinische Informatik (SGMI) und Jahrestagung 2004 des Arbeitskreises Medizinische Informatik (ÖAKMI) der Österreichischen Computer Gesellschaft (OCG) und der Österreichischen Gesellschaft für Biomedizinische Technik (ÖGBMT). Innsbruck, 26.-30.09.2004. Düsseldorf, Köln: German Medical Science; 2004. Doc04gmds353

The electronic version of this article is the complete one and can be found online at: http://www.egms.de/en/meetings/gmds2004/04gmds353.shtml

Published: September 14, 2004

© 2004 Stamm et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution License (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en). You are free: to Share – to copy, distribute and transmit the work, provided the original author and source are credited.


Outline

Text

Einleitung

Das Clinical Data Interchange Standards Consortium (CDISC) entwickelt ein Datenmodell (Submission Data Tabulation Model, SDTM) zur Einreichung klinischer Studien bei Regulationsbehörden. Mit der Mitarbeit der amerikanischen Nahrungs- und Arzneimittelbehörde (Food and Drug Administration, FDA) am Entstehensprozess steigt die Wahrscheinlichkeit, dass Version 3.1 [1] oder spätere zu einem Quasistandard erhoben werden. Ein wesentliches Merkmal dieses Datenmodells ist die Enteilung in klinische Bereiche („Domains"). Innerhalb dieser Bereiche werden die Daten durchgehend normalisiert, verschiedene Laborwerte werden zum Beispiel als Schlüssel-Wert-Paare gespeichert. Aus Prüfbögen über klassische Eingabeprogramme gewonnene Daten kennen diese Art der Zuordnung nicht in der Weise, sondern fordern die Zuordnung von eingegebenen Werten an Variablennamen. Wünschenswert ist daher ein studienunabhängiges Umordnungsprogramm, das die CRF-gebundenen Daten in eine normalisierte, SDTM-konforme Struktur überträgt und dabei den Umfang der manuellen Anpassungen möglichst gering hält.

Methoden

Ausgehend vom lokal validierten Datenmanagementsystem Entrypoint wurden an einer exemplarischen Studie Datentabellen („Prüfbogentabellen") generiert, die klassische Prüfbögenstrukturen reflektieren. Jede Variable wurde zur Überführung in die CDISC-Struktur in eine bereichspezifische Tabelle eingeordnet, deren Spalten die CDISC-Variablennamen für den jeweiligen Bereich darstellen. Eine weitere Spalte namens „condition" gibt an, unter welchen Bedingungen aus den Einträgen in der aktuellen Zeile der Prüfbogentabelle eine Zeile in der CDISC-Tabelle geschrieben wird. Ein Eintrag in „condition" enthält das Prädikat eines if-Ausdrucks, der wörtlich in SAS-Code überführt wird. Getreu der „Rule of Generation" („Avoid hand-hacking; write programs to write programs when you can") [1] wurde so durch allgemeingültigen SAS-Code jede originale Tabellenzeile in CDISC-kompatible Datenstrukturen überführt.

Ergebnisse

Der generierte SAS-Code ist gut les- und kontrollierbar, zudem kann die Planung anhand der Aufstellung von Tabellen geschehen, sodass Programmierfehler vermieden werden.

Diskussion

Die Bindung der Daten an eine CRF-Struktur erfordert spezifische Maßnahmen zur Überführung von Studiendaten in eine CDISC-kompatible Struktur. Durch die Umsetzung in Tabellen ist eine übersichtliche Darstellung der Zuordnung von bogenspezifischen Tabellen möglich. Aufwändige und fehleranfällige Programmierarbeit bei der Umstrukturierung der Tabellen wird auf ein Minimum reduziert. Der generierte Code ist so übersichtlich, dass er als Referenz für Kontrollzwecke gut geeignet ist.


Literatur

1.
Clinical Data Interchange Standards Consortium. Study Data Tabulation Model (Release 2), 2004, http:// www.cdisc.org/models/sds/v3.1/.
2.
Raymond ES.The Art of UNIX Programming. Addison-Wesley; 2003.