gms | German Medical Science

HEC 2016: Health — Exploring Complexity
2016 Joint Conference of GMDS, DGEpi, IEA-EEF, EFMI

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V.
Deutsche Gesellschaft für Epidemiologie e. V.

28.08. - 02.09.2016, München

Präferenz von linearen Regressionsmodellen bei Kindern – Ergebnisse einer ersten Pilotstudie

Meeting Abstract

Search Medline for

  • Nadine Maußner - University of Witten/Herdecke, Witten, Deutschland
  • Thomas Ostermann - Universität Witten/Herdecke, Witten, Deutschland

HEC 2016: Health – Exploring Complexity. Joint Conference of GMDS, DGEpi, IEA-EEF, EFMI. München, 28.08.-02.09.2016. Düsseldorf: German Medical Science GMS Publishing House; 2016. DocAbstr. 527

doi: 10.3205/16gmds106, urn:nbn:de:0183-16gmds1064

Published: August 8, 2016

© 2016 Maußner et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License. See license information at http://creativecommons.org/licenses/by/4.0/.


Outline

Text

Hintergrund: Die univariate lineare Regression ist eine statistische Methode, um Geraden der Form y=bx+t an gegebene Datenpaare (x1,y1),...,(xN,yN) anzupassen. Die am häufigsten verwandte Methode ist die der Ordinary Least Square-Methode (OLS(X|Y)), bei der Y als abhängige und X als unabhängige Variable verstanden wird. Die Regressionsgerade wird hier definiert durch das Minimum der Quadratsummen der Abstände der X-Variablen zur Geraden. Über die OLS(X|Y)-Methode hinaus gibt es vier weitere Verfahren, die nur wenig angewandt werden:

  • OLS(Y|X) hat X als abhängige und Y als unabhängige Variable. Hier wird die Regressionsgerade definiert durch das Minimum der Quadratsummen der Abstände der Y-Variablen zur Geraden.
  • OLS(bisector) halbiert den OLS(Y|X) und das Inverse von OLS(X|Y).
  • OR: Orthogonale Regression berechnet die Regressionsgerade über den Minimalen Abstand des Lotes auf der Gerade zum Datenpunkt.
  • RMA: Reduced Major Axis bildet das geometrische Mittel aus den Steigungen von OLS(X|Y) und OLS(Y|X).

Ziel: Ziel der Studie war es, die Präferenz von Kindern für eine der oben genannten Regressionsverfahren zu evaluieren. Davon unabhängig sollte der Einfluss von Geschlecht und Alter der Kinder auf das bevorzugte Modell untersucht werden.

Methode: Zunächst werden zwei zufällige Werte für die Parameter für b und t ausgewählt, die einem vorher ausgewählten Intervall entstammen. Anschließend werden zufällige x-Werte erzeugt, indem in einem bestimmten Intervall N gleichverteilte Werte durch die R-Funktion runif generiert werden. Zu den entsprechenden x-Koordinaten werden nun die entsprechenden y-Koordinaten der Gerade berechnet und dann mit einer zufälligen Schwankung var, in einem vorher definierten Intervall, addiert und dadurch verschoben. Im nächsten Schritt werden die entsprechenden Regressionen durchgeführt und anschließend die entsprechenden Gerade in die Abbildung mit den Datenpunkten eingefügt.

In insgesamt 13 Aufgaben wurden dann jeweils drei Abbildungen derselben Punktwolke mit verschiedenen Regressionsgeraden Kindern dargeboten, wobei sich diese für je eine der drei Geraden entscheiden konnten, die ihrer Meinung nach am besten zu den Punkten passten. Die anschließende statistische Auswertung der Häufigkeitsverteilungen auf Gleichverteilung, Altersgruppe und Geschlecht erfolgte mit dem Chi-Quadrat-Test.

Ergebnisse: Getestet wurden 72 Kinder der dritten (n=33) und vierten (n=39) Klasse. Davon waren 33 Mädchen und 39 Jungen. Von insgesamt 716 gültigen Antworten fielen 26,4% (n=189) auf die bisektorale Regression gefolgt von 22,6% (n=162) für OLS(X|Y). Für die orthogonale Regression entschieden sich mit n=109 Kindern (15,2%) die wenigsten. Dieses Ergebnis wich signifikant von der Gleichverteilung ab (Chi-Quadrat: 15,207; p=0,004). Ein Alterseffekt (3. Klasse vs. 4. Klasse) konnte dabei ebenso wenig nachgewiesen werden (Chi-Quadrat: 7,631; p= 0,106) wie ein Geschlechtseffekt (Chi-Quadrat: 2,363; p= 0,669).

Diskussion: Studien zeigen, dass Kinder bereits ein intuitives Verständnis für statistische Kenngrößen besitzen. Die in der vorliegenden Studie erzielten Ergebnisse zeigen eine deutliche Diskriminationsfähigkeit bei Kindern ohne Vorliegen eines theoretischen Hintergrunds. Welche Bedeutung die Präferenz der bisektoralen bzw. vertikalen vor der horizontalen bzw. orthogonalen Abstandsmetrik besitzt wird derzeit in weiteren Studien untersucht.


Literatur

1.
Keller G. Mathematik in den life sciences: Grundlagen der Modellbildung und Statistik mit einer Einführung in die Statistik-Software R (Vol. 3493). UTB; 2011.
2.
Migura J. Intuitive Statistik bei Menschenaffen: Kontrollstudien zu dem Cler Hans Phänomen und dem Geruchssinn. Akademiker Verlag; 2013.