gms | German Medical Science

MAINZ//2011: 56. GMDS-Jahrestagung und 6. DGEpi-Jahrestagung

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V.
Deutsche Gesellschaft für Epidemiologie e. V.

26. - 29.09.2011 in Mainz

Nutzung von öffentlichen Datenquellen in der Rehabilitationsforschung

Meeting Abstract

Search Medline for

  • Rainer Kaluscha - Forschungsinstitut für Rehabilitationsmedizin an der Universität Ulm, Bad Wurzach
  • Gert Krischak - Forschungsinstitut für Rehabilitationsmedizin an der Universität Ulm, Bad Wurzach

Mainz//2011. 56. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds), 6. Jahrestagung der Deutschen Gesellschaft für Epidemiologie (DGEpi). Mainz, 26.-29.09.2011. Düsseldorf: German Medical Science GMS Publishing House; 2011. Doc11gmds551

DOI: 10.3205/11gmds551, URN: urn:nbn:de:0183-11gmds5510

Published: September 20, 2011

© 2011 Kaluscha et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution License (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en). You are free: to Share – to copy, distribute and transmit the work, provided the original author and source are credited.


Outline

Text

Einleitung: Öffentliche Register und Datenquellen sind für epidemiologische Untersuchungen wertvolle Informationsquellen. Sie helfen aber auch, eigene Daten und Ergebnisse in einen größeren Zusammenhang einzuordnen und etwa die Übertragbarkeit von Ergebnissen auf die Gesamtbevölkerung abzuschätzen. Dabei bedarf es oft einer geschickten Nutzung und Kombination unterschiedlicher öffentlicher Datenquellen. Dies soll im folgenden Beispiel verdeutlicht werden.

Material und Methoden: Bei der Evaluation eines Modellprojektes soll der Einfluss einer intensivierten Betreuung der Rehabilitanden durch den Hausarzt untersucht werden. Dazu stellt die Deutsche Rentenversicherung Baden-Württemberg anonymisierte Daten der Projektteilnehmer und anderer Rehabilitanden aus ihrem Datenbestand zur Verfügung. Hauptzielgröße ist dabei der Erhalt des Arbeitsplatzes bzw. die berufliche Wiedereingliederung der Betroffenen. Diese lässt sich anhand der Tätigkeit (Berufsklassenschlüssel) und der Höhe der Rentenbeiträge evaluieren. Die Chancen für die berufliche Teilhabe der Rehabilitanden hängen aber nicht nur von medizinischen Aspekten, sondern auch von der regionalen Arbeitsmartktlage ab. Daher müssen über Berufsklassenschlüssel und Kreisschlüssel die entsprechenden Statistiken der Bundesagentur für Arbeit [1] in die Modelle einbezogen werden. Soweit der Kreisschlüssel nicht bekannt ist, kann er oft über die Daten von [2] oder [3] aus der Postleitzahl ermittelt werden. Um die regionalen Ergebnisse einordnen zu können, werden Vergleichsdaten zum bundesweiten Geschehen in der Rehabilitation, die beim Forschungsdatenzentrum der Rentenversicherung [4] sowie der Gesundheitsberichterstattung des Bundes [5] erhältlich sind, hinzugezogen.

Ergebnisse: Die gewünschten Informationen sind durchaus öffentlich verfügbar. Für die beabsichtigte Nutzung war aber z.T. erheblicher Aufwand erforderlich. Zum einen ist selbstverständlich die Kenntnis der Definition der Variablen der öffentlichen Datenquellen, ihrer Abgrenzungen bzw. Limitationen und mögliche Interpretationsspielräume Voraussetzung für eine adäquate Nutzung. Es bedurfte daher einer Einarbeitung in die Dokumentation zu den jeweiligen Datenquellen und den zugrunde liegenden Klassifikationen. Zum anderen ist einiges EDV-know-how erforderlich, um eigene und öffentliche Daten in ein gemeinsames Format zu bringen, da Datenformat und Detaillierungsgrad oft nicht übereinstimmten. So sind unterschiedliche Dateiformate im Umlauf (z.B. PDF, MS Excel, Datei mit Trennzeichen, MySQL-Dump) oder gleiche Informationen sind unterschiedlich kodiert, z.B. der Landkreis als Kreisschlüssel, als Kfz-Kennzeichen oder als Klartext. Weiters müssen feiner aufgelöste Daten auf das Niveau der gröber aufgelösten Datenquelle aggregiert werden, z.B. vierstellige Berufsklassenschlüssel zu dreistelligen Berufsordnungen.

Diskussion: Unabhängig von den o.a. praktischen Problemen kann durch die kreative Ergänzung eigener Daten aus öffentlichen Datenquellen ein echter Mehrwert für die Forschung erzielt werden. Dies gilt insbesondere dann, wenn eigene Ergebnisse aus beschränkten Stichproben in Beziehung zur Grundgesamtheit gesetzt werden können, da es nicht immer möglich ist, a priori repräsentative Stichproben zu ziehen oder potentielle Confounder mitzuerheben.


Literatur

1.
Statistik der Bundesagentur für Arbeit. Gemeldete Stellen Nürnberg, Juni 2010. Available from: http://statistik.arbeitsagentur.de, Register: „Statistik nach Themen“, Menüpunkt: Arbeitsmarkt [14.04.2011] External link
2.
Geonames.org. Download. Available from: http://www.geonames.org [14.04.2011] External link
3.
OpenGeoDB. Downloads. Available from: http://opengeodb.giswiki.org/wiki/OpenGeoDB_Downloads [14.04.2011] External link
4.
FDZ-RV. Scientific Use Files „Abgeschlossene Rehabilitation“ 2008 (SUFRSDQJ08B) nebst zugehörigem Codeplan. Available from: http://forschung.deutsche-rentenversicherung.de/FdzPortalWeb/dispcontent.do?id=main_fdz_forschung_querb [14.04.2011] External link
5.
Statistisches Bundesamt, Hrsg. Diagnosedaten der Patienten und Patientinnen in Vorsorge- oder Rehabilitationseinrichtungen, 2009. Artikelnummer: 2120622097004. Wiesbaden, 2011.