Artikel
Adäquate Regressionsmodelle für Fragestellungen der Versorgungsforschung für Zähldaten mit Zero Inflation
Suche in Medline nach
Autoren
Veröffentlicht: | 28. September 2016 |
---|
Gliederung
Text
Hintergrund: In der Versorgungsforschung sind Fragestellungen prävalent, die auf die Prädiktion patientenbezogener Zähldaten fokussieren. Beispielhaft sei hier die Anzahl von Hospitalisierungen in einem bestimmten Zeitraum genannt. Regressionsmodelle dienen der Ermittlung des Zusammenhanges zwischen erklärenden Variablen und einer bestimmten Zielgröße. Wenn es sich bei der Zielvariablen um eine Zählvariable handelt, sind bestimmte Regressionsmodelle mehr oder weniger angemessen. Poisson-Regressionsmodelle eignen sich für viele Problemstellungen mit Zähldaten. Allerdings kann sich eine überproportional hohe Beobachtung von 0-Werten (Zero Inflation) negativ auf die Güte des Regressionsmodells auswirken.
Fragestellung: An einem ausgewählten Datensatz aus einem Register der Versorgungsforschung (siehe Methode) wird am Beispiel von personenbezogenen Hospitalisierungsdaten ermittelt, ob und inwieweit die für die Poisson-Verteilung geltenden Annahmen verletzt wurden. Daraus ergab sich direkt die Frage, welche erweiterten oder alternativen Methoden zur adäquaten Regressionsschätzung existieren, und wie diese konkret eingesetzt werden können.
Methode: Auf eine pseudonymisierte Patientenstichprobe aus dem CONTENT-Register der Abteilung Allgemeinmedizin und Versorgungsforschung des Universitätsklinikums Heidelberg wurde die Anzahl der Hospitalisierungen Patientenkollektiv in Abhängigkeit von Alter, Geschlecht und Morbidität für das Beobachtungsjahr 2015 betrachtet. Mit dem Package „pscl“ der Statistiksoftware R stehen Funktionen zur Verfügung, die im gegebenen Kontext von Relevanz sind. Die Funktion „zeroinfl()“ wurde für den Anwendungsfall von Zähldaten mit Zero Inflation entwickelt.
Ergebnisse: Für den genannten Anwendungsfall zeigte sich zunächst, dass ein Standard-Poisson-Regressionsmodells durch die vorliegende Zero Inflation nicht gut geeignet war. Das Ausmaß der Zero Inflation war in der gegebenen Stichprobe beträchtlich. Es ergab sich, dass ein Regressionsmodell unter Berücksichtigung der Funktion „zeroinfl()“ den Zusammenhang zwischen der Zielgröße und den erklärenden Variablen deutlich besser beschrieb. Dies konnte anhand geeigneter Modellgütekriterien gezeigt werden.
Diskussion: Eine Zero Inflation bei Zähldaten ist eine häufige regressionsanalytische Herausforderung, insbesondere auch in der Versorgungsforschung. Eine Möglichkeit für einen angemessenen Umgang in diesem Kontext wurde auf der Basis eines Kalküls aufgezeigt. Weitere methodische Ansätze werden diskutiert, darunter auch Regressionsmodelle auf Basis der negativen Binomialverteilung. Außerdem wird kurz auf weitere Statistik-Software eingegangen, die ebenfalls gute Lösungsoptionen im gegebenen Zusammenhang bieten. Darüber hinaus werden modernere „Bayesian Zero-Inflated Poisson Regression Models“ diskutiert.
Praktische Implikationen: Bei Zähldaten sollten das Vorliegen von Zero Inflations geprüft, erkannt und gegebenenfalls regressionsanalytisch entsprechend berücksichtigt werden. Existierende Statistik-Softwarepakete stellen hier eine Reihe von adäquaten und verständlichen Modulen mit korrespondierenden Methoden zur Verfügung.