gms | German Medical Science

MAINZ//2011: 56. GMDS-Jahrestagung und 6. DGEpi-Jahrestagung

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V.
Deutsche Gesellschaft für Epidemiologie e. V.

26. - 29.09.2011 in Mainz

Nutzung von öffentlichen Datenquellen in der Rehabilitationsforschung

Meeting Abstract

Suche in Medline nach

  • Rainer Kaluscha - Forschungsinstitut für Rehabilitationsmedizin an der Universität Ulm, Bad Wurzach
  • Gert Krischak - Forschungsinstitut für Rehabilitationsmedizin an der Universität Ulm, Bad Wurzach

Mainz//2011. 56. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds), 6. Jahrestagung der Deutschen Gesellschaft für Epidemiologie (DGEpi). Mainz, 26.-29.09.2011. Düsseldorf: German Medical Science GMS Publishing House; 2011. Doc11gmds551

doi: 10.3205/11gmds551, urn:nbn:de:0183-11gmds5510

Veröffentlicht: 20. September 2011

© 2011 Kaluscha et al.
Dieser Artikel ist ein Open Access-Artikel und steht unter den Creative Commons Lizenzbedingungen (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.de). Er darf vervielfältigt, verbreitet und öffentlich zugänglich gemacht werden, vorausgesetzt dass Autor und Quelle genannt werden.


Gliederung

Text

Einleitung: Öffentliche Register und Datenquellen sind für epidemiologische Untersuchungen wertvolle Informationsquellen. Sie helfen aber auch, eigene Daten und Ergebnisse in einen größeren Zusammenhang einzuordnen und etwa die Übertragbarkeit von Ergebnissen auf die Gesamtbevölkerung abzuschätzen. Dabei bedarf es oft einer geschickten Nutzung und Kombination unterschiedlicher öffentlicher Datenquellen. Dies soll im folgenden Beispiel verdeutlicht werden.

Material und Methoden: Bei der Evaluation eines Modellprojektes soll der Einfluss einer intensivierten Betreuung der Rehabilitanden durch den Hausarzt untersucht werden. Dazu stellt die Deutsche Rentenversicherung Baden-Württemberg anonymisierte Daten der Projektteilnehmer und anderer Rehabilitanden aus ihrem Datenbestand zur Verfügung. Hauptzielgröße ist dabei der Erhalt des Arbeitsplatzes bzw. die berufliche Wiedereingliederung der Betroffenen. Diese lässt sich anhand der Tätigkeit (Berufsklassenschlüssel) und der Höhe der Rentenbeiträge evaluieren. Die Chancen für die berufliche Teilhabe der Rehabilitanden hängen aber nicht nur von medizinischen Aspekten, sondern auch von der regionalen Arbeitsmartktlage ab. Daher müssen über Berufsklassenschlüssel und Kreisschlüssel die entsprechenden Statistiken der Bundesagentur für Arbeit [1] in die Modelle einbezogen werden. Soweit der Kreisschlüssel nicht bekannt ist, kann er oft über die Daten von [2] oder [3] aus der Postleitzahl ermittelt werden. Um die regionalen Ergebnisse einordnen zu können, werden Vergleichsdaten zum bundesweiten Geschehen in der Rehabilitation, die beim Forschungsdatenzentrum der Rentenversicherung [4] sowie der Gesundheitsberichterstattung des Bundes [5] erhältlich sind, hinzugezogen.

Ergebnisse: Die gewünschten Informationen sind durchaus öffentlich verfügbar. Für die beabsichtigte Nutzung war aber z.T. erheblicher Aufwand erforderlich. Zum einen ist selbstverständlich die Kenntnis der Definition der Variablen der öffentlichen Datenquellen, ihrer Abgrenzungen bzw. Limitationen und mögliche Interpretationsspielräume Voraussetzung für eine adäquate Nutzung. Es bedurfte daher einer Einarbeitung in die Dokumentation zu den jeweiligen Datenquellen und den zugrunde liegenden Klassifikationen. Zum anderen ist einiges EDV-know-how erforderlich, um eigene und öffentliche Daten in ein gemeinsames Format zu bringen, da Datenformat und Detaillierungsgrad oft nicht übereinstimmten. So sind unterschiedliche Dateiformate im Umlauf (z.B. PDF, MS Excel, Datei mit Trennzeichen, MySQL-Dump) oder gleiche Informationen sind unterschiedlich kodiert, z.B. der Landkreis als Kreisschlüssel, als Kfz-Kennzeichen oder als Klartext. Weiters müssen feiner aufgelöste Daten auf das Niveau der gröber aufgelösten Datenquelle aggregiert werden, z.B. vierstellige Berufsklassenschlüssel zu dreistelligen Berufsordnungen.

Diskussion: Unabhängig von den o.a. praktischen Problemen kann durch die kreative Ergänzung eigener Daten aus öffentlichen Datenquellen ein echter Mehrwert für die Forschung erzielt werden. Dies gilt insbesondere dann, wenn eigene Ergebnisse aus beschränkten Stichproben in Beziehung zur Grundgesamtheit gesetzt werden können, da es nicht immer möglich ist, a priori repräsentative Stichproben zu ziehen oder potentielle Confounder mitzuerheben.


Literatur

1.
Statistik der Bundesagentur für Arbeit. Gemeldete Stellen Nürnberg, Juni 2010. Available from: http://statistik.arbeitsagentur.de, Register: „Statistik nach Themen“, Menüpunkt: Arbeitsmarkt [14.04.2011] Externer Link
2.
Geonames.org. Download. Available from: http://www.geonames.org [14.04.2011] Externer Link
3.
OpenGeoDB. Downloads. Available from: http://opengeodb.giswiki.org/wiki/OpenGeoDB_Downloads [14.04.2011] Externer Link
4.
FDZ-RV. Scientific Use Files „Abgeschlossene Rehabilitation“ 2008 (SUFRSDQJ08B) nebst zugehörigem Codeplan. Available from: http://forschung.deutsche-rentenversicherung.de/FdzPortalWeb/dispcontent.do?id=main_fdz_forschung_querb [14.04.2011] Externer Link
5.
Statistisches Bundesamt, Hrsg. Diagnosedaten der Patienten und Patientinnen in Vorsorge- oder Rehabilitationseinrichtungen, 2009. Artikelnummer: 2120622097004. Wiesbaden, 2011.