next up previous index
Nächste Seite: Determinationskoeffizient Aufwärts: Regression und Korrelation Vorherige Seite: Regressionsanalyse   Index


Regressionskoeffizient

Der Regressionskoeffizient (engl.: regression coefficient) einer »unabhängigen Variablen« $ X$ mißt den Einfluß dieser Variablen auf die »Zielvariable« $ Y$ in einer »Regressionsanalyse«. Einfluß meint in diesem Fall die quantitative Veränderung von $ Y$, wenn sich $ X$ um eine Einheit ändert. Handelt es sich um ein lineares Regressionsmodell, ist diese Veränderung immer gleich, egal welches Niveau $ X$ aufweist.

Im einfachsten Fall der bivariaten Regression, $ \hat y_{i}= b_{0} + b_{1} x_{i}$, werden die Schätzer der Regressionskoeffizienten mit $ b_{0}$ und $ b_{1}$ bezeichnet. $ b_{1}$ mißt die Veränderung in $ Y$, wenn sich $ X$ um eine Einheit ändert. Der Regressionskoeffizient $ b_{0}$, die sogenannte Regressionskonstante, hat eine besondere Bedeutung. Sie entspricht dem Wert der Zielvariablen, wenn die unabhängige Variable den Wert 0 aufweist. Die Interpretation der Regressionskonstanten ist jedoch nur dann sinnvoll, wenn ein Wert von 0 empirisch bei der unabhängigen Variablen auftreten kann.

Beispiele: Die Humankapitaltheorie unterstellt, daß das durch Ausbildung entgangene Einkommen sowie die Ausbildungskosten im späteren Berufsleben durch höhere Einkommen ausgeglichen werden. Ein Mehr an Ausbildung führt zu einem höheren Einkommen im Beruf. Zur Untersuchung dieser Hypothese wurde eine Regression der Nettoarbeitseinkommen ($ Y$, in DM) auf die Dauer der Schul- und Berufsausbildung ($ X$, in Jahren) in einer Stichprobe von männlichen Beschäftigten berechnet, mit folgenden Schätzergebnissen: $ b_{0}=670$, $ b_{1}=130$.[*] $ b_{1}$ zeigt, daß die untersuchten Personen mit jedem Jahr zusätzlicher Ausbildung 130 DM mehr verdienen. Hätte jemand gar keine Ausbildung genossen ($ X=0$), würde er 670 DM verdienen, wie man an $ b_{0}$ erkennen kann. Die Regressionskonstante sollte jedoch nicht interpretiert werden, denn $ X=0$ ist in diesem Beispiel kein inhaltlich sinnvoller Wert. Das niedrigste vorkommende Ausbildungsniveau ist ein Hauptschulabschluß ohne Berufsausbildung, der mit 9 Jahren Ausbildungsdauer veranschlagt wurde. Für dieses Ausbildungsniveau ergibt sich aufgrund des Regressionsmodells ein geschätztes Arbeitseinkommen von 1.840 DM ( $ =670 + 130 \cdot 9$).

In einer multiplen Regression mit mehreren unabhängigen Variablen spricht man von multiplen Regressionskoeffizienten. Auch sie messen den Einfluß der jeweiligen unabhängigen Variablen auf die Zielvariable, dieses Mal jedoch unter Konstanthaltung aller anderen, im Modell kontrollierten unabhängigen Variablen (vgl. »Drittvariablenkontrolle bei kontinuierlichen Variablen«). Werden mehrere unabhängige Variablen berücksichtigt, entsteht in der Regel die Frage, welche davon die abhängige Variable am stärksten beeinflußt. Den Effekt der einzelnen Variablen mißt der jeweilige Regressionskoeffizient. Haben die unabhängigen Variablen jedoch unterschiedliche Maßeinheiten, läßt sich die Größe der Regressionskoeffizienten nicht vergleichen. Man berechnet daher zusätzlich sogenannte standardisierte Regressionskoeffizienten, die den Einfluß unterschiedlicher Maßeinheiten ausgleichen. Sie ergeben sich aus den ursprünglichen unstandardisierten Regressionskoeffizienten, indem man diese mit der Standardabweichung der entsprechenden unabhängigen Variablen multipliziert und durch die Standardabweichung der abhängigen Variablen dividiert. Das Problem unterschiedlicher Maßeinheiten wird quasi dadurch gelöst, daß alle Variablen des Regressionsmodells in einer einheitlichen statistischen Maßeinheit gemessen werden (vgl. »z-Transformation«). Im bivariaten Fall entspricht der standardisierte Regressionskoeffizient von $ X$ im übrigen dem »Korrelationskoeffizienten $ r$« der Variablen $ X$ und $ Y$.

Notation: Regressionskonstante und Regressionskoeffizient der linearen Einfachregression werden von vielen Autoren mit $ a$ und $ b$ bezeichnet. Allgemeiner ist jedoch die Verwendung eines Buchstabens mit unterschiedlichen Indizes, wobei der Index 0 jeweils die Regressionskonstante kennzeichnet: $ b_{0}, b_{1}, b_{2}, \ldots, b_{k}$ in der Stichprobe, $ \beta_{0}, \beta_{1}, \beta_{2}, \ldots, \beta_{k}$ (griech.: beta) in der Grundgesamtheit. Leider werden die standardisierten Regressionskoeffizienten auch als Beta-Gewichte bezeichnet, was zu Verwechslungen mit den unstandardisierten Koeffizienten $ \beta_{0}, \beta_{1}, \beta_{2}, \ldots, \beta_{k}$ führen kann.


next up previous index
Nächste Seite: Determinationskoeffizient Aufwärts: Regression und Korrelation Vorherige Seite: Regressionsanalyse   Index
HJA 2001-10-01