gms | German Medical Science

66. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS), 12. Jahreskongress der Technologie- und Methodenplattform für die vernetzte medizinische Forschung e. V. (TMF)

26. - 30.09.2021, online

Das Weglassen von nicht-konfundierenden Prädiktoren im logistischen Regressionsmodell beeinflusst die OR der anderen Prädiktoren und ihre p-Werte wenig

Meeting Abstract

Search Medline for

  • Nora Eisemann - Universität zu Lübeck, Lübeck, Germany

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie. 66. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS), 12. Jahreskongress der Technologie- und Methodenplattform für die vernetzte medizinische Forschung e.V. (TMF). sine loco [digital], 26.-30.09.2021. Düsseldorf: German Medical Science GMS Publishing House; 2021. DocAbstr. 28

doi: 10.3205/21gmds104, urn:nbn:de:0183-21gmds1047

Published: September 24, 2021

© 2021 Eisemann.
This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License. See license information at http://creativecommons.org/licenses/by/4.0/.


Outline

Text

Hintergrund: Die logistische Regression gehört zu den bekanntesten statistischen Methoden in der Epidemiologie. Unter Anwender*innen ist nicht oder kaum bekannt, dass das Aufnehmen oder Entfernen eines Prädiktors aus dem logistischen Regressionsmodell das Odds-Ratio (OR) der anderen Prädiktoren selbst dann beeinflusst, wenn er nur mit der Zielgröße, aber nicht mit den anderen Prädiktoren, zusammenhängt [1].

Hier soll mit einer Simulation eine erste Einschätzung ermöglicht werden, wie relevant die Änderungen durch dieses Phänomen für die angewandte Forschung sind.

Methoden: In 10.000 Simulationen mit je 100 Beobachtungen wurden jeweils eine binäre Zielgröße und sechs voneinander unabhängige Prädiktoren erzeugt, die schwach (zwei Prädiktoren mit OR 1,3), mittel (zwei Prädiktoren mit OR 1,8) oder stark (zwei Prädiktoren mit OR 3,3) mit der Zielgröße zusammenhingen. Für jeden Prädiktor einzeln und jede Zweier-Kombination wurde ein logistisches Regressionsmodell angepasst und die Veränderung der OR und p-Werte (Wald-Test) festgehalten.

Ergebnisse: Grundsätzlich stiegen die OR durch Hinzunehmen eines weiteren Prädiktors, während die p-Werte sanken. Die Anstiege waren gering: eine Veränderung um einen Punkt in der ersten Nachkommastelle war nur zu beobachten, wenn einem mittelstarken Prädiktor ein starker hinzugefügt wurde, oder wenn einem starken Prädiktor ein mindestens mittelstarker hinzugefügt wurde. Das Sinken der p-Werte ist besonders interessant, wenn die Grenze zur Signifikanz (≤5%) überschritten wird; das geschah mit ca. 4,8% am häufigsten bei mittelstarken Prädiktoren, wenn ein starker Prädiktor hinzugenommen wurde.

Diskussion: Wie aus der Theorie zur unbeobachteten Heterogenität in der logistischen Regression zu erwarten war, vergrößerte das Hinzunehmen von Prädiktoren das OR des interessierenden Prädiktors und verkleinerte seinen p-Wert. Das Ausmaß der Veränderung war in dieser einfachen Simulation grundsätzlich eher gering. In der Praxis mögen Fälle auftreten, in denen Unterschiede in OR und p-Wert durch die Adjustierung mit einer oder mehreren weiteren Prädiktoren inhaltlich bedeutsam sind. Bei der Interpretation von Ergebnissen und beim Vergleich von ORs sollte berücksichtigt werden, dass das OR von der unbeobachteten Heterogenität abhängt.

Die Autoren geben an, dass kein Interessenkonflikt besteht.

Die Autoren geben an, dass kein Ethikvotum erforderlich ist.


Literatur

1.
Mood C. Logistic regression: Why we cannot do what we think we can do, and what we can do about it. European Sociological Review. 2010;26:67-82.