Artikel
Halbautomatische Normalisierung bei der Überführung von Studiendaten in eine CDISC-kompatible Struktur
Suche in Medline nach
Autoren
Veröffentlicht: | 14. September 2004 |
---|
Gliederung
Text
Einleitung
Das Clinical Data Interchange Standards Consortium (CDISC) entwickelt ein Datenmodell (Submission Data Tabulation Model, SDTM) zur Einreichung klinischer Studien bei Regulationsbehörden. Mit der Mitarbeit der amerikanischen Nahrungs- und Arzneimittelbehörde (Food and Drug Administration, FDA) am Entstehensprozess steigt die Wahrscheinlichkeit, dass Version 3.1 [Ref. 1] oder spätere zu einem Quasistandard erhoben werden. Ein wesentliches Merkmal dieses Datenmodells ist die Enteilung in klinische Bereiche („Domains"). Innerhalb dieser Bereiche werden die Daten durchgehend normalisiert, verschiedene Laborwerte werden zum Beispiel als Schlüssel-Wert-Paare gespeichert. Aus Prüfbögen über klassische Eingabeprogramme gewonnene Daten kennen diese Art der Zuordnung nicht in der Weise, sondern fordern die Zuordnung von eingegebenen Werten an Variablennamen. Wünschenswert ist daher ein studienunabhängiges Umordnungsprogramm, das die CRF-gebundenen Daten in eine normalisierte, SDTM-konforme Struktur überträgt und dabei den Umfang der manuellen Anpassungen möglichst gering hält.
Methoden
Ausgehend vom lokal validierten Datenmanagementsystem Entrypoint wurden an einer exemplarischen Studie Datentabellen („Prüfbogentabellen") generiert, die klassische Prüfbögenstrukturen reflektieren. Jede Variable wurde zur Überführung in die CDISC-Struktur in eine bereichspezifische Tabelle eingeordnet, deren Spalten die CDISC-Variablennamen für den jeweiligen Bereich darstellen. Eine weitere Spalte namens „condition" gibt an, unter welchen Bedingungen aus den Einträgen in der aktuellen Zeile der Prüfbogentabelle eine Zeile in der CDISC-Tabelle geschrieben wird. Ein Eintrag in „condition" enthält das Prädikat eines if-Ausdrucks, der wörtlich in SAS-Code überführt wird. Getreu der „Rule of Generation" („Avoid hand-hacking; write programs to write programs when you can") [Ref. 1] wurde so durch allgemeingültigen SAS-Code jede originale Tabellenzeile in CDISC-kompatible Datenstrukturen überführt.
Ergebnisse
Der generierte SAS-Code ist gut les- und kontrollierbar, zudem kann die Planung anhand der Aufstellung von Tabellen geschehen, sodass Programmierfehler vermieden werden.
Diskussion
Die Bindung der Daten an eine CRF-Struktur erfordert spezifische Maßnahmen zur Überführung von Studiendaten in eine CDISC-kompatible Struktur. Durch die Umsetzung in Tabellen ist eine übersichtliche Darstellung der Zuordnung von bogenspezifischen Tabellen möglich. Aufwändige und fehleranfällige Programmierarbeit bei der Umstrukturierung der Tabellen wird auf ein Minimum reduziert. Der generierte Code ist so übersichtlich, dass er als Referenz für Kontrollzwecke gut geeignet ist.