gms | German Medical Science

GMS Medizinische Informatik, Biometrie und Epidemiologie

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS)

ISSN 1860-9171

Abbildbarkeit des sozioökonomischen Status in der pharmakoepidemiologischen Forschungsdatenbank GePaRD: Beschreibung und Anwendung am Beispiel des Zusammenhangs mit Adipositas

Originalarbeit

  • Marieke Asendorf - Abteilung Klinische Epidemiologie, Leibniz-Institut für Präventionsforschung und Epidemiologie – BIPS, Bremen, Deutschland
  • Jonas Reinold - Abteilung Klinische Epidemiologie, Leibniz-Institut für Präventionsforschung und Epidemiologie – BIPS, Bremen, Deutschland
  • Tania Schink - Abteilung Klinische Epidemiologie, Leibniz-Institut für Präventionsforschung und Epidemiologie – BIPS, Bremen, Deutschland
  • Bianca Kollhorst - Abteilung Biometrie und EDV, Leibniz-Institut für Präventionsforschung und Epidemiologie – BIPS, Bremen, Deutschland
  • corresponding author Ulrike Haug - Abteilung Klinische Epidemiologie, Leibniz-Institut für Präventionsforschung und Epidemiologie – BIPS, Bremen, Deutschland; Fachbereich Human- und Gesundheitswissenschaften, Universität Bremen, Deutschland

GMS Med Inform Biom Epidemiol 2022;18(1):Doc02

doi: 10.3205/mibe000235, urn:nbn:de:0183-mibe0002350

Dieses ist die deutsche Version des Artikels.
Die englische Version finden Sie unter: http://www.egms.de/en/journals/mibe/2022-18/mibe000235.shtml

Veröffentlicht: 12. Mai 2022

© 2022 Asendorf et al.
Dieser Artikel ist ein Open-Access-Artikel und steht unter den Lizenzbedingungen der Creative Commons Attribution 4.0 License (Namensnennung). Lizenz-Angaben siehe http://creativecommons.org/licenses/by/4.0/.


Zusammenfassung

Hintergrund: Der sozioökonomische Status stellt bei vielen epidemiologischen Fragestellungen eine wichtige Einfluss- bzw. Störgröße dar. Dennoch wird diese Information in Studien basierend auf Versichertendaten oft nicht berücksichtigt, vermutlich auch da unklar ist, wie vollständig bzw. aussagekräftig die vorliegenden Informationen sind.

Ziel der Arbeit: Ziel war, den sozioökonomischen Status für die pharmakoepidemiologische Forschungsdatenbank GePaRD zu erfassen und zu bewerten.

Methodik: Zunächst wurde ein Algorithmus entwickelt, der den Versicherten im Jahr 2017 einen Schulbildungsstatus zuordnet und so den sozioökonomischen Status auf individueller Ebene schätzt. Zum Vergleich wurde der sozioökonomische Status basierend auf dem Wohnort geschätzt. Zur Plausibilisierung wurde untersucht, ob sich der bekannte Zusammenhang zwischen dem Vorliegen einer Adipositas und dem sozioökonomischen Status reproduzieren lässt.

Ergebnisse: Es konnte je nach Altersgruppe für 86–93% der unter 60-Jährigen und für 67% der 60- bis 69-Jährigen der sozioökonomische Status dichotom geschätzt werden. Für Personen ab 70 Jahren war der Anteil fehlender Werte sehr hoch. In allen Subgruppen war die Prävalenz der Adipositas bei Personen mit niedrigem sozioökonomischen Status höher als bei Personen mit höherem sozioökonomischen Status. Die wohnortbasierte Schätzung zeigte zwar auch plausible Ergebnisse, doch mit schwächeren Unterschieden nach sozioökonomischem Status.

Diskussion und Fazit: Insgesamt legen die Studienergebnisse nahe, dass sich die in GePaRD verfügbaren Informationen für eine Abschätzung des individuellen sozioökonomischen Status bei Altersgruppen bis 69 Jahren, was Plausibilität und Vollständigkeit betrifft, gut eignen.

Schlüsselwörter: sozioökonomischer Status, Bildung, sozialer Deprivationsindex, Versichertendaten, Adipositas


Einleitung

Wissenschaftliche Untersuchungen belegen seit Jahrzehnten, dass die Bürde verschiedenster Krankheiten sozial unausgewogen verteilt ist. In den meisten Fällen tragen dabei sozial benachteiligte Gruppen die größere Krankheitslast [1], [2], [3]. Ein ausgeprägter Zusammenhang besteht beispielsweise zwischen dem sozioökonomischen Status und dem Vorliegen einer Adipositas [4], [5], [6], [7], [8]. So berichten zum Beispiel Großschädl/Stronegger basierend auf Survey-Daten für Frauen mit grundlegendem Schulabschluss eine Adipositas-Prävalenz, die um etwa 13 Prozentpunkte höher ist als bei Frauen mit Hochschulreife. Für Männer wurde in dieser Studie ein Unterschied von etwa 9 Prozentpunkten beobachtet [9].

Dementsprechend wichtig ist es, Informationen zum sozioökonomischen Status in epidemiologischen Studien als mögliche Einfluss- bzw. Störgröße zu berücksichtigen. In Studien, die auf Primärdaten basieren, werden hierfür in der Regel Informationen zu schulischen und beruflichen Abschlüssen, zum Beruf oder zum Einkommen erhoben [6], [10]. Neben Primärdaten stellen Abrechnungsdaten von Krankenversicherungen eine zunehmend wichtige Datenquelle für die Versorgungsforschung und die epidemiologische Forschung dar. Die pharmakoepidemiologische Forschungsdatenbank (German Pharmacoepidemiological Research Database, kurz: GePaRD) beispielsweise enthält Abrechnungsdaten von vier gesetzlichen Krankenversicherungen, deckt etwa 20% der deutschen Bevölkerung ab und umfasst aktuell die Datenjahre 2004–2017. GePaRD wird für zahlreiche Studien im Bereich der Arzneimittelanwendungs- und -risikoforschung und der Krebsfrüherkennung genutzt. Auch bei vielen dieser Studien ist die Berücksichtigung des sozioökonomischen Status von großer Relevanz bzw. Interesse, doch wurde bisher nicht systematisch untersucht, inwiefern in GePaRD vorhandene Variablen geeignet sind, um den sozioökonomischen Status abzubilden bzw. in welcher Vollständigkeit diese vorliegen.

Grundsätzlich gibt es in den Daten der gesetzlichen Krankenversicherungen verschiedene Möglichkeiten, den sozioökonomischen Status abzuschätzen (siehe Tabelle 1 [Tab. 1]). In GePaRD bieten sich zwei Variablen an, die Informationen zum sozioökonomischen Status liefern könnten. Zum einen liegt in den Daten der Kreisschlüssel des Wohnorts der Versicherten vor, der – verknüpft mit dem regionalen Deprivationsindex des jeweiligen Landkreises – genutzt werden kann, um den sozioökonomischen Status anhand aggregierter Informationen abzuschätzen, d.h. allen Personen eines Landkreises wird der gleiche sozioökonomische Status zugeordnet. Zum anderen liegt eine Variable vor, die Informationen zum Beruf, zur beruflichen Stellung und zur Ausbildung der Versicherten gemäß Schlüsselverzeichnis der Bundesagentur für Arbeit enthält und damit eine Möglichkeit darstellt, den sozioökonomischen Status auf individueller Ebene abzuschätzen. Ziel dieser Studie war es, die Vollständigkeit dieser beiden Informationen in GePaRD zu untersuchen sowie deren Aussagekraft und Plausibilität bzgl. des sozioökonomischen Status indirekt zu bewerten, indem jeweils der Zusammenhang mit dem Vorliegen einer Adipositas ermittelt wurde.


Methoden

Datenquelle und Studienpopulation

Basis dieser Untersuchung war die pharmakoepidemiologische Forschungsdatenbank GePaRD. Sie enthält Abrechnungsdaten von vier gesetzlichen Krankenversicherungen in Deutschland und umfasst Informationen von derzeit ca. 25 Millionen Personen, die seit 2004 oder danach bei einer der teilnehmenden Krankenversicherungen versichert waren. Neben demographischen Angaben enthält GePaRD Informationen zu Arzneimittelverordnungen sowie zu ambulanten und stationären Leistungen und Diagnosen. Pro Datenjahr stehen Informationen zu ungefähr 20% der Allgemeinbevölkerung zur Verfügung und es sind alle geographischen Regionen Deutschlands vertreten. Für diese Auswertungen wurden die Daten der Jahre 2004 bis 2017 genutzt. Eingeschlossen wurden alle Versicherten aus GePaRD, die im Jahr 2017 mindestens an einem Tag versichert und an diesem Tag am Leben waren, für die eine Angabe zum Geschlecht, zum Geburtsjahr und zum Wohnort vorlag und deren Wohnort innerhalb Deutschlands lag.

Abschätzung des sozioökonomischen Status auf individueller Ebene

Ausgangspunkt war eine Variable, die in den Versichertenstammdaten enthalten ist und Informationen zum Beruf, zur beruflichen Stellung und zur Ausbildung enthält. Diese Informationen, die mit dem Begriff „Tätigkeitsschlüssel“ zusammengefasst werden, werden von den Arbeitgebenden gemäß §28a Sozialgesetzbuch (SGB) IV an die Sozialversicherungsträger für alle versicherungspflichtigen und freiwilligen Hauptversicherten mindestens jährlich übermittelt. Dementsprechend steht die Information unter anderem nicht für Personen zur Verfügung, die in dem jeweiligen Jahr bereits in Rente sind, sowie für sonstige Versicherte und Familienversicherte [11].

Die Operationalisierung dieser Variable wurde von folgenden Prinzipien geleitet:
A) Der Fokus sollte auf der Abschätzung des sozioökonomischen Status basierend auf den Informationen zur schulischen Bildung liegen.
B) Sofern eindeutig, wurden die Informationen zum beruflichen Abschluss oder zur beruflichen Stellung einbezogen, um Rückschlüsse auf die schulische Bildung zu ziehen. So wurde beispielsweise bei Personen mit universitärem Abschluss unabhängig von den Informationen zu ihrer schulischen Bildung von (fachgebundener) Hochschulreife ausgegangen.
C) Mit dem Ziel, den Personen, die im Jahr 2017 versichert waren, einen Bildungsstand zuzuordnen, wurde auch auf frühere Datenjahre zurückgegriffen. Bei verrenteten Personen beispielsweise konnte damit teilweise auf die Zeit der Berufstätigkeit zurückgegriffen werden, d.h. auf Jahre, in denen noch ein Tätigkeitsschlüssel übermittelt wurde.
D) Es wurde angenommen, dass Familienversicherte einen ähnlichen sozioökonomischen Status haben wie die zugehörigen Hauptversicherten. Auf Basis dieser Annahme wurde versucht, Personen, zu denen in keinem der Datenjahre ein Tätigkeitsschlüssel vorlag, mit einer familienangehörigen Person, der bereits ein Status zugeordnet werden konnte, über eine gemeinsame Versicherung in GePaRD zu verknüpfen. Für diese Verknüpfung wurde die ebenfalls in den Versichertenstammdaten enthaltene Familien-ID verwendet.
E) Lieferten die Daten unterschiedlicher Kalenderjahre diskrepante Informationen zur Bildung, wurde jeweils der höchste Bildungsstand herangezogen. Dem liegt die Annahme zugrunde, dass sich der erworbene Bildungsstand nicht verringert, sondern sich durch eine weitere schulische Ausbildung allenfalls erhöhen kann.

Basierend auf dieser Operationalisierung wurden die Versicherten in die folgenden drei Kategorien eingeteilt:

1.
(Fachgebundene) Hochschulreife,
2.
Hauptschulabschluss oder mittlere Reife,
3.
Bildung unbekannt.

In der letzten Kategorie wurden die Versicherten mit den Ausprägungen „Bildung unbekannt“ und „kein Abschluss“ sowie mit fehlendem Wert bzgl. schulischer Bildung zusammengefasst, da erwartet wurde, dass die Gruppe „kein Abschluss“ klein ist. Diese Einteilung orientiert sich an den Möglichkeiten, die der Tätigkeitsschlüssel bot, bevor er 2011 auf ein neues Klassifizierungssystem umgestellt wurde [11], [12], [13]. Das neue Klassifizierungssystem bietet zusätzlich die Möglichkeit, zwischen Hauptschulabschluss und mittlerer Reife zu unterscheiden (Abbildung 1 [Abb. 1]). An GePaRD wurde der Tätigkeitsschlüssel gemäß der neuen Klassifikation jedoch größtenteils erst ab dem Datenstand von 2017 übermittelt. Um auch das Potenzial des neuen Tätigkeitsschlüssels zu untersuchen, führten wir Sensitivitätsanalysen durch. Hierfür wurde die Population der Hauptanalyse auf Personen beschränkt, deren Bildungsstatus auf Informationen über die berufliche oder schulische Bildung des Klassifikationssystems nach 2011 basiert.

Abschätzung des sozioökonomischen Status anhand der Informationen zum Wohnort

Die aktuellsten in GePaRD zur Verfügung stehenden Informationen zum Wohnort auf Kreisebene wurde mit dem vom Robert Koch-Institut (RKI) entwickelten German Index of Socioeconomic Deprivation (GISD) verknüpft, wobei die Revision dieses Index verwendet wurde, die auf Daten von 2014 basiert. Der Index gibt das Ausmaß der Deprivation basierend auf den drei Dimensionen Einkommen, Bildung und Beruf wieder [14]. Passend zur kleinsten räumlichen Einheit in GePaRD wurde der GISD auf Kreisebene verwendet (weitere Erläuterungen im Appendix (Anhang 1 [Anh. 1]). Analog zum Vorgehen von Kroll et al. wurden die den Kreisen zugeordneten Deprivations-Scores in Quintile eingeteilt (erstes Quintil: „niedrige Deprivation“; zweites bis viertes Quintil: „mittlere Deprivation“; fünftes Quintil: „hohe Deprivation“) [14].

Erfassung von Informationen zum Vorliegen einer Adipositas

Die Erfassung des Vorliegens einer Adipositas basierte zum einen auf den hierfür relevanten ICD-10-Codes (stationär oder gesichert ambulant) sowie auf Codes für Prozeduren, die auf eine Therapie einer Adipositas hinweisen (z.B. magenverkleinernde chirurgische Eingriffe). Eine Person wurde als adipös klassifiziert, wenn für sie in GePaRD mindestens einer der relevanten Codes vorlag. Dabei wurde nicht nur das Datenjahr 2017 betrachtet, sondern auch alle in GePaRD verfügbaren Datenjahre zu dieser Person vor 2017. Dem liegt die Überlegung zugrunde, dass es sich bei Adipositas in der Regel um eine chronische und damit dauerhaft vorliegende Gesundheitsstörung handelt. Da sie vermutlich oft nur codiert wird, wenn dies als Abrechnungsgrund relevant ist, was nicht jedes Jahr der Fall sein muss, erhöht sich durch das Zurückgreifen auf frühere Datenjahre die Sensitivität der Erfassung der Adipositas.

Auswertung der Daten in GePaRD

Zunächst wurde zur Beurteilung der Vollständigkeit der individuellen Information zur schulischen Bildung in GePaRD der Anteil der Versicherten im Jahr 2017 ermittelt, denen basierend auf dem oben beschriebenen Vorgehen eine schulische Bildung zugeordnet werden konnte. Zur Ermittlung der Adipositas-Prävalenz wurden die Versicherten des Jahres 2017, bei denen gemäß oben beschriebenem Vorgehen eine Adipositas vorlag, im Zähler betrachtet und alle Personen aus der beschriebenen Versichertenkohorte im Nenner. Die so berechnete Adipositas-Prävalenz wurde in den Hauptanalysen gemäß der dichotomen Klassifikation stratifiziert nach (Fach-) Hochschulreife vs. Real- oder Hauptschulabschluss ermittelt. In der Sensitivitätsanalyse wurde die Prävalenz stratifiziert nach den drei Kategorien (Fach-)Hochschulreife, mittlere Reife und Hauptschulabschluss ermittelt. Für die Auswertungen basierend auf dem GISD wurde analog vorgegangen, d.h. die Adipositas-Prävalenz wurde stratifiziert nach den Kategorien niedrige, mittlere und hohe sozioökonomische Deprivation ermittelt. Alle Analysen wurden hinsichtlich Alter und Geschlecht der Versicherten stratifiziert.

Vergleichende Auswertung von Primärdaten

Ergänzend zu den Auswertungen basierend auf GePaRD wurden die im Rahmen der GEDA-2014/2015-Befragung des RKI erhobenen Primärdaten vergleichend ausgewertet [15], d.h. es wurde auch die Adipositas-Prävalenz nach Alter, Geschlecht und Schulbildung (in den Kategorien (Fach-)Abitur, mittlere Reife und Hauptschulabschluss) ermittelt. An der Befragung, die mittels elektronischer Fragebögen oder Telefoninterviews durchgeführt wurde, nahmen 24.016 Personen ab 18 Jahren mit Hauptwohnsitz in Deutschland teil [16].


Ergebnisse

Nach Anwendung der Ein- und Ausschlusskriterien (258.013 Personen wurden aufgrund fehlender Informationen ausgeschlossen; davon hatten 217.600 Personen keine gültige Angabe zum Wohnort in Deutschland) wurden 17.317.559 Personen in die Untersuchung eingeschlossen (Anteil Frauen: 53%). Insgesamt konnte für 73% der Frauen und 78% der Männer der sozioökonomische Status auf individueller Ebene gemäß dem beschriebenen Algorithmus approximiert werden.

Bei etwa der Hälfte der Männer und Frauen lagen Informationen zum eigenen Bildungsabschluss vor. Bei weiteren ca. 20% lag zwar keine eigene Bildungsinformation vor, aber es konnten Personen aus der Familie mit vorhandener Bildungsinformation zugeordnet werden und damit konnte der sozioökonomische Status indirekt abgeschätzt werden (siehe Abbildung 2 [Abb. 2]). Der Anteil der Versicherten, denen über den Algorithmus ein sozioökonomischer Status zugeordnet werden konnte, lag in den Altersgruppen unter 60 Jahren bei Männern und Frauen durchweg über 85%, bei 60–69-Jährigen bei 67% (Frauen: 63%, Männer: 72%), bei 70–79-Jährigen bei 16% (Frauen: 10%, Männern: 23%) und bei Personen ab 80 Jahren unter 1% (Frauen: 0,3%, Männer: 1%) (siehe Tabelle 2 [Tab. 2]). Der Anteil ohne Bildungsabschluss an allen Versicherten betrug über alle Subgruppen hinweg weniger als 1%.

Abbildung 3 [Abb. 3] zeigt die in GePaRD beobachtete Adipositas-Prävalenz stratifiziert nach Altersgruppen, Geschlecht und zugeordnetem Bildungsstand (Hauptschulabschluss/mittlere Reife und (Fach-)Hochschulreife) auf individueller Ebene. In allen Altersgruppen und bei beiden Geschlechtern war die Prävalenz der Adipositas, die insgesamt mit dem Alter anstieg, bei Personen mit niedrigerem Bildungsstand höher. Die Punktschätzer der Prävalenz bei Frauen mit 30-39 Jahren waren beispielsweise ca. 9 Prozentpunkte über denen der Personen mit höherer Bildung (22% vs. 13%). In der gleichen Altersgruppe betrug die Differenz bei den Männern ca. 5 Prozentpunkte (12% vs. 7%). In Abb. 7 (Anhang 1 [Anh. 1]) ist die Adipositas-Prävalenz für alle Kategorien inkl. der Kategorien „Bildung unbekannt“, kein formaler Bildungsabschluss und Personen ohne jegliche Angabe zum Bildungsabschluss vergleichend dargestellt. In Abb. 8 (Anhang 1 [Anh. 1]) wird die Adipositas-Prävalenz außerdem für die zwei Gruppen mit bzw. ohne Information zur Bildung verglichen. Dabei zeigt sich bei Männern in beiden Gruppen eine weitgehend übereinstimmende Prävalenz, außer bei den 18- bis 29-Jährigen (niedrigere Adipositas-Prävalenz in der Gruppe mit fehlender Information zur Bildung). Bei Frauen zeigt sich bis zum Alter von 50 Jahren ein ähnliches Muster wie bei Männern. Bei älteren Frauen zeigt sich in der Gruppe mit Information zur Bildung eine höhere Adipositas-Prävalenz als bei Frauen ohne Information zur Bildung.

In die Sensitivitätsanalysen zur Einteilung des Bildungsstands in drei Kategorien (Hauptschulabschluss, Realschulabschluss und (Fach-)Abitur) konnten 27% der Versicherten eingeschlossen werden (24% der Männer, 29% der Frauen). Es zeigte sich in allen Subgruppen unter 80 Jahren ein inverser Zusammenhang zwischen Adipositas-Prävalenz und Bildungsstatus, wobei der Unterschied zwischen den Kategorien Realschul- vs. Hauptschulabschluss kleiner war (beispielsweise 5% Prozentpunkte bei den 30- bis 39-jährigen Frauen) als der Unterschied zwischen den Kategorien Realschulabschluss vs. (Fach-)Hochschulreife (8 Prozentpunkte bei den 30- bis 39-jährigen Frauen) (Abbildung 4 [Abb. 4]). Der maximale Unterschied in der Adipositas-Prävalenz zwischen Personen mit Hauptschulabschluss vs. Personen mit (Fach-)Hochschulreife lag bei 13 Prozentpunkten und wurde in der Subgruppe der 30- bis 39-jährigen Frauen beobachtet.

Die Ergebnisse zum Zusammenhang zwischen der in GePaRD beobachteten Adipositas-Prävalenz und dem mittels räumlichem Deprivationsindex des Wohnorts (Kreisebene) abgeschätzten sozioökonomischen Status sind in Abbildung 5 [Abb. 5] dargestellt. Auch hier zeigt sich in allen Altersgruppen und für beide Geschlechter eine Zunahme der Adipositas-Prävalenz mit steigender Deprivation. Die Unterschiede sind im Vergleich zur Auswertung basierend auf dem individuell abgeschätzten sozioökonomischen Status weniger ausgeprägt. Der Unterschied zwischen den Subgruppen mit der höchsten bzw. der niedrigsten Deprivation beträgt bei den 30- bis 39-jährigen Frauen ca. 8 Prozentpunkte (21% vs. 13%) und bei den Männern dieser Altersklasse ca. 4 Prozentpunkte (11% vs. 7%).

Die Ergebnisse der Vergleichsanalyse auf Basis des GEDA-2014/2015-Datensatzes sind in Abbildung 6 [Abb. 6] dargestellt. Dieser Datensatz enthält Informationen zum Bildungsstand auf individueller Ebene, d.h. die Ergebnisse können den in Abbildung 3 [Abb. 3] dargestellten Ergebnissen zu GePaRD gegenübergestellt werden. Im Vergleich zu GePaRD zeigte sich in einigen Subgruppen – vor allem in höheren Altersgruppen – eine etwas andere, oft niedrigere Adipositas-Prävalenz, aber insgesamt waren die Muster, was die Unterschiede zwischen den Bildungsgruppen betrifft, ähnlich. Tendenziell war der absolute Unterschied in der Adipositas-Prävalenz zwischen den Bildungsgruppen bei GEDA stärker ausgeprägt und zeigte weniger Geschlechtsunterschiede als bei GePaRD. Bei den 40- bis 49-jährigen Frauen beispielsweise betrug der Unterschied zwischen der höheren und der niedrigeren Bildungsgruppe 7 Prozentpunkte (GePaRD: 7 Prozentpunkte) und bei 40- bis 49-jährigen Männern betrug der Unterschied 8 Prozentpunkte (GePaRD: 4 Prozentpunkte).


Diskussion

Die Ergebnisse dieser Studie zeigen, dass es anhand von individuellen Informationen, die in der pharmakoepidemiologischen Forschungsdatenbank GePaRD verfügbar sind, möglich ist, etwa drei Viertel der Versicherten in eine höhere bzw. niedrigere Bildungskategorie als Annäherung an den sozioökonomischen Status einzuteilen. Die Tatsache, dass basierend auf dieser Zuordnung der bekannte Zusammenhang hinsichtlich Adipositas und sozioökonomischem Status reproduziert werden konnte, bestätigt die Plausibilität dieser Klassifikation. Auch für die Abschätzung des sozioökonomischen Status anhand des Landkreises des Wohnorts zeigten sich insgesamt plausible Ergebnisse. Der in diesen Analysen beobachtete Unterschied zwischen den 20% Versicherten mit dem niedrigsten bzw. dem höchsten Deprivations-Score (d.h. 60% der Versicherten bleiben bei dem Vergleich unberücksichtigt) entsprach jedoch im Ausmaß dem Unterschied, der bei der individuellen Abschätzung des sozioökonomischen Status bereits bei einer nur dichotomen Einteilung aller Versicherten mit vorhandener Bildungsinformation beobachtet wurde. Bei Einteilung des Bildungsstands in drei Kategorien waren die Unterschiede dann noch deutlich ausgeprägter, was insgesamt auch dafür spricht, dass die Trennschärfe der Abschätzung des sozioökonomischen Status basierend auf individuellen Informationen größer ist als bei Abschätzung basierend auf dem Landkreis des Wohnorts.

Die Stärke des Zusammenhangs zwischen dem Vorliegen einer Adipositas und dem sozioökonomischen Status sowie die Unterschiede nach Alter und Geschlecht waren insgesamt konsistent mit den Ergebnissen der Vergleichsanalysen, die wir basierend auf den GEDA-Daten durchgeführt haben. Für einige Subgruppen war der Unterschied nach sozioökonomischem Status in den GEDA-Analysen etwas stärker ausgeprägt als in den GePaRD-Analysen. Bei den 50- bis 59-Jährigen beispielsweise zeigten die GEDA-Analysen für Personen mit Haupt-/Realschulabschluss im Vergleich zur höheren Bildungsgruppe eine zweifach (Frauen) bzw. 1,5-fach (Männer) erhöhte Adipositas-Prävalenz, während die GePaRD-Analysen eine 1,4-fach höhere Prävalenz für Männer und Frauen zeigten. Beim Vergleich der Ergebnisse ist jedoch zu berücksichtigen, dass in den GEDA-Analysen die Schätzer zum Teil weite Konfidenzintervalle haben. Auch ist zu bedenken, dass schon wegen der unterschiedlichen Art der Erfassung der Adipositas keine volle Übereinstimmung zu erwarten war. In Versicherungsdaten erscheinen Diagnosen vor allem dann, wenn sie abrechnungstechnisch relevant sind, d.h. wenn Leistungen im Zusammenhang mit der Diagnose erbracht wurden. In den GePaRD-Analysen wurde eine sensitive Falldefinition angewendet, was zu einer Überschätzung der Prävalenz im Erwachsenenalter geführt haben könnte. Bei der Definition von Adipositas in GEDA, die auf Eigenangaben zu Körpergröße und Gewicht basiert, gibt es andere Gründe, die zu einer Missklassifikation geführt haben könnten. So ist bekannt, dass Körpergewicht und -größe in Befragungen oft falsch angegeben werden [17]. Laut Maukonen et al. führt diese Missklassifikation in europäischen Studien zu einer Unterschätzung der Adipositas-Prävalenz um 0,6 bis 8,4 Prozentpunkte [17]. Somit enthält keine der beiden Datenquellen Goldstandard-Informationen hinsichtlich des Vorliegens einer Adipositas, weshalb Unterschiede in der Stärke des Zusammenhangs nicht überinterpretiert werden sollten. Dies gilt auch für den Vergleich mit anderen Studien, die aber insgesamt ebenfalls ähnliche Zusammenhänge zwischen dem individuell abgeschätzten sozioökonomischen Status und dem Vorliegen einer Adipositas zeigen [6], [7], [9].

Die Abschätzung des individuellen sozioökonomischen Status in unseren Analysen basierte auf den in GePaRD verfügbaren Informationen zum Tätigkeitsschlüssel. Grundsätzlich wären in Versichertendaten auch Informationen vorhanden, die eine noch genauere Abschätzung des sozioökonomischen Status ermöglichen würden, wie etwa die Beitragshöhe, die auf das Einkommen schließen lässt, oder der genaue Wohnort. Da es sich hierbei jedoch um sehr sensible Informationen handelt, stehen sie für kassenexterne Sekundärdatennutzung in der Regel nicht zur Verfügung. Die meisten der bisherigen Studien basierend auf Kassendaten, die den sozioökonomischen Status berücksichtigten, nutzten deshalb (grobe) Informationen zum Wohnort. Eine ältere Studie von Geyer basierend auf Daten von 416.000 Versicherten der AOK Mettmann aus den Jahren 1987–1996 zeigte zwar bereits das Potenzial der Nutzung von Informationen zu Bildung und Beruf zur Abschätzung des individuellen sozioökonomischen Status in Versichertendaten [1], doch fand dies in neueren Studien nur wenig Berücksichtigung. Dies könnte zum einen daran liegen, dass den Datenauswertenden der Tätigkeitsschlüssel nicht zur Verfügung stand, zum anderen ist aber auch die Ansicht verbreitet, dass die Informationen nicht in der notwendigen Vollständigkeit bzw. Eindeutigkeit vorliegen [18]. In den GePaRD-Analysen konnten wir die Vollständigkeit durch das Zurückgreifen auf den langen Vorbeobachtungszeitraum in Verbindung mit der Verknüpfung von Familienversicherten sowie weiteren Rückschlüssen und Annahmen deutlich erhöhen. Eine dieser Annahmen, nämlich die Übertragbarkeit des sozioökonomischen Status von Hauptversicherten auf Familienangehörige, wurde zwar in der Literatur kontrovers diskutiert [19], [20], [21], doch ist sie aus unserer Sicht gut zu vertreten und basiert auf ähnlichen Annahmen wie die Verwendung des Familieneinkommens in primärdatenbasierten Studien.

Mit GePaRD als Datenquelle in Kombination mit der hier angewendeten Methodik ist es gelungen, für 86–93% der unter 60-Jährigen den individuellen sozioökonomischen Status grob (Hauptschulabschluss/mittlere Reife und (Fach-)Hochschulreife) abzuschätzen. Auch bei den 60- bis 69-Jährigen lag dieser Anteil noch bei 67% (Männer: 72% Frauen: 63%). Es ist außer Frage, dass es sich – aus mehreren Gründen – hierbei nicht um eine perfekte Klassifikation des sozioökonomischen Status handelt. Abgesehen von den zugrundeliegenden Annahmen kann auch nicht immer davon ausgegangen werden, dass die Meldung der Beschäftigungsschlüssel durch die Arbeitgebenden grundsätzlich fehlerfrei erfolgt [11]. Außerdem deckt der Bildungsstand nicht alle Dimensionen des sozioökonomischen Status ab [22]. Für zahlreiche deskriptive oder analytische Fragestellungen, die basierend auf Versichertendaten bearbeitet werden, ist jedoch auch diese grobe Abschätzung des sozioökonomischen Status von großem Wert. Dies umso mehr, als er auch als Ersatzparameter für sonstige Faktoren, die in Versichertendaten schlecht abgebildet sind (z.B. Lebensstilfaktoren), Bedeutung hat. So kann der derart geschätzte sozioökonomische Status zur Stratifizierung und Adjustierung genutzt werden, um die Relevanz als Einflussfaktor oder Störfaktor zumindest ansatzweise zu erkennen bzw. zu berücksichtigen. Bei der Einordnung der oben genannten Limitationen ist außerdem zu bedenken, dass auch die Schätzung des sozioökonomischen Status basierend auf Primärdaten u.a. aufgrund fehlender Angaben oft suboptimal ist.

Bei der Verwendung des GISD zur Schätzung des sozioökonomischen Status war der bekannte Zusammenhang zwischen niedrigem sozioökonomischen Status (bzw. hoher Deprivation) und Adipositas schwächer ausgeprägt als bei der individuellen Schätzung des sozioökonomischen Status in drei Kategorien, was nicht überraschend war [23], [24]. Da der Wohnort in GePaRD auf Kreisebene vorliegt, wird auch der GISD mit diesem Raumbezug verwendet. Damit können für Deutschland 401 regionale Einheiten unterschieden werden. Diese Einteilung ist sehr grob und trägt den Unterschieden im sozioökonomischen Status zwischen Individuen einer Region keine Rechnung, d.h. es ist von einer erheblichen Missklassifikation auszugehen. Dementsprechend ist die Schätzung des individuellen sozioökonomischen Status in GePaRD sowohl dichotom als auch in drei Kategorien gegenüber dem GISD vorzuziehen. Der GISD könnte als zweitbeste Option in Betracht gezogen werden, wenn der individuelle sozioökonomische Status nicht geschätzt werden kann, was bei Personen ab 70 Jahren derzeit häufig der Fall ist, da bei ihnen oft nicht auf die Zeit der Berufstätigkeit zurückgegriffen werden kann. Es ist aber abzusehen, dass perspektivisch, d.h. mit noch längerer Beobachtungszeit in GePaRD, der Anteil mit fehlendem Tätigkeitsschlüssel auch bei den Älteren weiter abnimmt. Gleichermaßen ist abzusehen, dass für immer mehr Personen Bildungs- und Berufsinformationen nach dem neuen Klassifikationssystem vorliegen werden, d.h. in Zukunft wäre so, besonders für junge Menschen, eine Einteilung in drei Bildungskategorien möglich.

Der Vergleich der Adipositas-Prävalenz bei Personen mit vs. ohne Information zur Bildung (Abb. 8 (Anhang 1 [Anh. 1])) zeigt, dass insbesondere bei 18- bis 29-jährigen Männern und Frauen sowie bei Frauen ab 50 Jahren Unterschiede zwischen beiden Gruppen vorliegen. In diesen Gruppen scheint somit ein Zusammenhang zwischen dem Vorhandensein von Informationen zur Bildung und dem Sozialstatus zu bestehen. Bei den 18- bis 29-Jährigen erscheint dies plausibel, da in dieser Gruppe vermutlich Studierende enthalten sind (höherer Bildungsstand), die noch über ihre Eltern versichert sind. Da die Eltern zu dem Zeitpunkt teilweise bereits das Rentenalter erreicht haben und damit der Tätigkeitsschlüssel fehlt, ergeben sich auch für die Mitversicherten fehlende Werte. Personen, die hingegen eine Berufsausbildung durchlaufen (tendenziell niedrigerer Bildungsstand) beziehen in diesem Alter schon ein eigenes Gehalt und sind selbst versichert, d.h. es liegt ein Tätigkeitsschlüssel vor. Das Muster bei älteren Frauen lässt sich möglicherweise dadurch erklären, dass Frauen mit niedrigerem Bildungsstand häufiger keinen eigenen Beruf ausüben, sondern bei ihrem Ehemann mitversichert sind, der bereits in Rente ist (d.h. häufig fehlender Tätigkeitsschlüssel). Aufgrund dieser Zusammenhänge sollte in zukünftigen Auswertungen die Kategorie „missing“ gesondert betrachtet werden, v.a. was die 18- bis 29-Jährigen sowie Frauen über 50 Jahren betrifft.


Fazit

Insgesamt zeigen die hier dargestellten Studienergebnisse, dass sich die in GePaRD verfügbaren Informationen für eine dichotome Abschätzung des individuellen sozioökonomischen Status bei Altersgruppen bis 69 Jahren gut eignen, sowohl was die Vollständigkeit als auch was die Plausibilität betrifft. Bei Personen ab 70 Jahren könnte die Abschätzung des sozioökonomischen Status basierend auf dem GISD als zweitbeste Option genutzt werden, bis – mit noch längerer Beobachtungszeit in GePaRD – auch für diese Altersgruppen eine höhere Vollständigkeit erreicht sein wird.


Anmerkungen

Interessenkonflikte

Die Autoren und Autorinnen erklären, dass sie keine Interessenkonflikte in Zusammenhang mit diesem Artikel haben.

Marieke Asendorf, Jonas Reinold, Tania Schink, Bianca Kollhorst und Ulrike Haug forschen an einem unabhängigen, gemeinnützigen Forschungsinstitut, dem Leibniz-Institut für Präventionsforschung und Epidemiologie – BIPS. Das BIPS führt mitunter Studien durch, welche durch die Arzneimittelindustrie gefördert werden. Dabei handelt es sich fast ausschließlich um Sicherheitsstudien nach der Zulassung (PASS), die von Gesundheitsbehörden angefordert werden. Die Planung und Durchführung dieser Studien sowie deren Interpretation und Publikation werden nicht von der Arzneimittelindustrie beeinflusst. Die vorgestellte Studie wurde nicht von der Arzneimittelindustrie gefördert und wurde unter Einhaltung des ENCePP-Verhaltenskodex durchgeführt.

Danksagung

Die Autoren und Autorinnen danken den Gesetzlichen Krankenkassen AOK Bremen/Bremerhaven, Die Techniker (TK), DAK-Gesundheit und hkk Krankenkasse, die Daten für diese Studie bereitgestellt haben.

ORCIDs der Autoren und Autorinnen


Literatur

1.
Geyer S. Sozialstruktur und Krankheit. Analysen mit Daten der Gesetzlichen Krankenversicherung [Social inequalities in health. Analysis using data from statutory health insurance companies]. Bundesgesundheitsblatt Gesundheitsforschung Gesundheitsschutz. 2008 Oct;51(10):1164-72. DOI: 10.1007/s00103-008-0651-1 Externer Link
2.
Richter M, Hurrelmann K. Gesundheitliche Ungleichheit: Ausgangsfragen und Herausforderungen. In: Richter M, Hurrelmann K, editors. Gesundheitliche Ungleichheit. Wiesbaden: VS Verlag für Sozialwissenschaften; 2009. p. 11-31.
3.
Wilkinson R, Marmot M. Soziale Determinanten von Gesundheit. Die Fakten. 2. Ausgabe. Kopenhagen: World Health Organization Europe; 2004.
4.
Greiner W, Batram M, Damm O, Scholz S, Witte J. Kinder- und Jugendreport 2018 – Gesundheitsvorsorge von Kindern und Jugendlichen in Deutschland. Schwerpunkt: Familiengesundheit. Bielefeld & Hamburg; 2018.
5.
Lamerz A, Kuepper-Nybelen J, Wehle C, Bruning N, Trost-Brinkhues G, Brenner H, Hebebrand J, Herpertz-Dahlmann B. Social class, parental education, and obesity prevalence in a study of six-year-old children in Germany. Int J Obes (Lond). 2005 Apr;29(4):373-80. DOI: 10.1038/sj.ijo.0802914 Externer Link
6.
Lampert T, Kroll LE, von der Lippe E, Müters S, Stolzenberg H. Sozioökonomischer Status und Gesundheit: Ergebnisse der Studie zur Gesundheit Erwachsener in Deutschland (DEGS1) [Socioeconomic status and health: results of the German Health Interview and Examination Survey for Adults (DEGS1)]. Bundesgesundheitsblatt Gesundheitsforschung Gesundheitsschutz. 2013 May;56(5-6):814-21. DOI: 10.1007/s00103-013-1695-4 Externer Link
7.
Mensink GB, Schienkiewitz A, Haftenberger M, Lampert T, Ziese T, Scheidt-Nave C. Übergewicht und Adipositas in Deutschland: Ergebnisse der Studie zur Gesundheit Erwachsener in Deutschland (DEGS1) [Overweight and obesity in Germany: results of the German Health Interview and Examination Survey for Adults (DEGS1)]. Bundesgesundheitsblatt Gesundheitsforschung Gesundheitsschutz. 2013 May;56(5-6):786-94. DOI: 10.1007/s00103-012-1656-3 Externer Link
8.
OECD. Health at a Glance. Paris: OECD Publishing; 2019.
9.
Großschädl F, Stronegger WJ. Long-term trends (1973-14) for obesity and educational inequalities among Austrian adults: men in the fast lane. Eur J Public Health. 2019 Aug;29(4):790-6. DOI: 10.1093/eurpub/cky280 Externer Link
10.
Hajek A, Lehnert T, Ernst A, Lange C, Wiese B, Prokein J, Weyerer S, Werle J, Pentzek M, Fuchs A, Luck T, Bickel H, Mösch E, Heser K, Wagner M, Maier W, Scherer M, Riedel-Heller SG, König HH; AgeCoDe Study Group. Prevalence and determinants of overweight and obesity in old age in Germany. BMC Geriatr. 2015 Jul;15:83. DOI: 10.1186/s12877-015-0081-5 Externer Link
11.
Damm K, Lange A, Zeidler J, Braun S, Graf von der Schulenburg JM. Einführung des neuen Tätigkeitsschlüssels und seine Anwendung in GKV-Routinedatenauswertungen. Möglichkeiten und Limitationen [Implementation of the new German job role code and its application in claims data analysis. Possibilities and limitations]. Bundesgesundheitsblatt Gesundheitsforschung Gesundheitsschutz. 2012 Feb;55(2):238-44. DOI: 10.1007/s00103-011-1418-7 Externer Link
12.
Bundesagentur für Arbeit. Schlüsselverzeichnis für die Angaben zur Tätigkeit in den Meldungen zur Sozialversicherung. Nürnberg: Bundesagentur für Arbeit; 2007.
13.
Bundesagentur für Arbeit. Schlüsselverzeichnis für die Angaben zur Tätigkeit in den Meldungen zur Sozialversicherung. Ausgabe 2010. Stand: Mai 2017. Nürnberg: Bundesagentur für Arbeit; 2010.
14.
Kroll LE, Schumann M, Hoebel J, Lampert T. Regionale Unterschiede in der Gesundheit – Entwicklung eines sozioökonomischen Deprivationsindex für Deutschland. J Health Monit. 2017;2(2):103-20. DOI: 10.17886/RKI-GBE-2017-035 Externer Link
15.
Robert-Koch-Insitut, Abteilung für Epidemiologie und Gesundheitsmonitoring. Gesundheit in Deutschland aktuell (GEDA 2014/2015-EHIS). Scientific Use File. 1. Version. Berlin: Robert-Koch-Insitut; 2015.
16.
Saß AC, Lange C, Finger JD, Allen J, Born S, Hoebel J, Kuhnert R, Müters S, Thelen J, Schmich P, Varga M, von der Lippe E, Wetzstein M, Ziese T. „Gesundheit in Deutschland aktuell“ – Neue Daten für Deutschland und Europa Hintergrund und Studienmethodik von GEDA 2014/2015-EHIS. J Health Monit. 2017;2(1):83-90. DOI: 10.17886/RKI-GBE-2017-012 Externer Link
17.
Maukonen M, Männistö S, Tolonen H. A comparison of measured versus self-reported anthropometrics for assessing obesity in adults: a literature review. Scand J Public Health. 2018 Jul;46(5):565-79. DOI: 10.1177/1403494818761971 Externer Link
18.
Schubert I, Köster I, Küpper-Nybelen J, Ihle P. Versorgungsforschung mit GKV-Routinedaten. Nutzungsmöglichkeiten versichertenbezogener Krankenkassendaten für Fragestellungen der Versorgungsforschung [Health services research based on routine data generated by the SHI. Potential uses of health insurance fund data in health services research]. Bundesgesundheitsblatt Gesundheitsforschung Gesundheitsschutz. 2008 Oct;51(10):1095-105. DOI: 10.1007/s00103-008-0644-0 Externer Link
19.
Geyer S. Die Bestimmung der sozioökonomischen Position in Prozessdaten und ihre Verwendung in Sekundärdatenanalysen. In: Swart E, Ihle P, Gothe H, Matusiewicz D, editors. Routinedaten im Gesundheitswesen Handbuch Sekundärdatenanalyse: Grundlagen, Methoden und Perspektiven. Bern: Verlag Hans Huber; 2005. p. 203-7.
20.
Lidfeldt J, Li TY, Hu FB, Manson JE, Kawachi I. A prospective study of childhood and adult socioeconomic status and incidence of type 2 diabetes in women. Am J Epidemiol. 2007 Apr;165(8):882-9. DOI: 10.1093/aje/kwk078 Externer Link
21.
Muschik D, Jaunzeme J, Geyer S. Are spouses' socio-economic classifications interchangeable? Examining the consequences of a commonly used practice in studies on social inequalities in health. Int J Public Health. 2015 Dec;60(8):953-60. DOI: 10.1007/s00038-015-0744-1 Externer Link
22.
Lampert T, Kroll LE. Die Messung des sozioökonomischen Status in sozialepidemiologischen Studien. In: Richter M, Hurrelmann K, editors. Gesundheitliche Ungleichheit: Grundlagen, Probleme, Perspektiven. Wiesbaden: VS Verlag für Sozialwissenschaften; 2009. p. 309-34.
23.
Jacobs E, Tönnies T, Rathmann W, Brinks R, Hoyer A. Association between regional deprivation and type 2 diabetes incidence in Germany. BMJ Open Diabetes Res Care. 2019;7(1):e000857. DOI: 10.1136/bmjdrc-2019-000857 Externer Link
24.
Kauhl B, Maier W, Schweikart J, Keste A, Moskwyn M. Exploring the small-scale spatial distribution of hypertension and its association to area deprivation based on health insurance claims in Northeastern Germany. BMC Public Health. 2018 Jan;18(1):121. DOI: 10.1186/s12889-017-5017-x Externer Link
25.
Grobe T, Ihle P. Versichertenstammdaten und sektorübergreifende Analyse. In: Swart E, Ihle P, Gothe H, Matusiewicz D, editors. Routinedaten im Gesundheitswesen. Handbuch Sekundärdatenanalyse: Grundlagen, Methoden und Perspektiven. Bern: Verlag Hans Huber; 2005. p. 17-34.
26.
Wahrendorf M, Rupprecht CJ, Dortmann O, Scheider M, Dragano N. Erhöhtes Risiko eines COVID-19-bedingten Krankenhausaufenthaltes für Arbeitslose: Eine Analyse von Krankenkassendaten von 1,28 Mio. Versicherten in Deutschland [Higher risk of COVID-19 hospitalization for unemployed: an analysis of health insurance data from 1.28 million insured individuals in Germany]. Bundesgesundheitsblatt Gesundheitsforschung Gesundheitsschutz. 2021 Mar;64(3):314-21. DOI: 10.1007/s00103-021-03280-6 Externer Link