Die Regression ist eine statistische Methode, die im Finanzwesen, bei Investitionen und in anderen Disziplinen verwendet wird und mit der versucht wird, die Stärke und den Charakter der Beziehung zwischen einer abhängigen Variablen (in der Regel mit Y bezeichnet) und einer Reihe anderer Variablen (den so genannten unabhängigen Variablen) zu bestimmen.
Die lineare Regression, auch einfache Regression oder gewöhnliche kleinste Quadrate (OLS) genannt, ist die häufigste Form dieser Technik. Die lineare Regression stellt die lineare Beziehung zwischen zwei Variablen auf der Grundlage einer Linie der besten Anpassung fest. Die lineare Regression wird also grafisch durch eine gerade Linie dargestellt, wobei die Steigung angibt, wie sich die Veränderung einer Variablen auf die Veränderung der anderen auswirkt. Der y-Achsenabschnitt einer linearen Regressionsbeziehung stellt den Wert einer Variablen dar, wenn der Wert der anderen gleich Null ist. Es gibt auch nichtlineare Regressionsmodelle, die jedoch wesentlich komplexer sind.
Die Regressionsanalyse ist ein leistungsfähiges Instrument zur Aufdeckung von Assoziationen zwischen in Daten beobachteten Variablen, kann aber nicht ohne Weiteres auf Kausalität schließen. Sie wird in verschiedenen Zusammenhängen in der Geschäfts-, Finanz- und Wirtschaftswelt eingesetzt. So wird sie beispielsweise verwendet, um Investmentmanagern bei der Bewertung von Vermögenswerten zu helfen und die Beziehungen zwischen Faktoren wie den Rohstoffpreisen und den Aktien von Unternehmen, die mit diesen Rohstoffen handeln, zu verstehen.
Die Regression als statistisches Verfahren sollte nicht mit dem Konzept der Regression zum Mittelwert (mean reversion) verwechselt werden.
SCHLUSSFOLGERUNGEN
- Eine Regression ist eine statistische Technik, die eine abhängige Variable mit einer oder mehreren unabhängigen (erklärenden) Variablen in Beziehung setzt.
- Ein Regressionsmodell kann zeigen, ob die in der abhängigen Variable beobachteten Veränderungen mit den Veränderungen einer oder mehrerer erklärender Variablen zusammenhängen.
- Dies geschieht im Wesentlichen durch die Anpassung einer Best-Fit-Linie und die Feststellung, wie sich die Daten um diese Linie herum verteilen.
- Die Regression hilft Wirtschaftswissenschaftlern und Finanzanalysten bei der Bewertung von Vermögenswerten und der Erstellung von Prognosen.
- Damit die Regressionsergebnisse richtig interpretiert werden können, müssen mehrere Annahmen über die Daten und das Modell selbst zutreffen.
Verständnis der Regression
Die Regression erfasst die Korrelation zwischen den in einem Datensatz beobachteten Variablen und quantifiziert, ob diese Korrelationen statistisch signifikant sind oder nicht.
Die beiden grundlegenden Arten der Regression sind die einfache lineare Regression und die multiple lineare Regression, obwohl es auch nichtlineare Regressionsmethoden für kompliziertere Daten und Analysen gibt. Bei der einfachen linearen Regression wird eine unabhängige Variable verwendet, um das Ergebnis der abhängigen Variable Y zu erklären oder vorherzusagen, während bei der multiplen linearen Regression zwei oder mehr unabhängige Variablen verwendet werden, um das Ergebnis vorherzusagen (während alle anderen Variablen konstant gehalten werden).
Die Regression kann Finanz- und Investitionsfachleuten sowie Fachleuten in anderen Branchen helfen. Regression kann auch helfen, den Umsatz eines Unternehmens auf der Grundlage des Wetters, früherer Verkäufe, des BIP-Wachstums oder anderer Bedingungen vorherzusagen. Das Capital Asset Pricing Model (CAPM) ist ein im Finanzwesen häufig verwendetes Regressionsmodell zur Bewertung von Vermögenswerten und zur Ermittlung der Kapitalkosten.
Regression und Ökonometrie
Ökonometrie ist eine Reihe von statistischen Techniken, die zur Analyse von Daten im Finanz- und Wirtschaftsbereich verwendet werden. Ein Beispiel für die Anwendung der Ökonometrie ist die Untersuchung des Einkommenseffekts anhand beobachtbarer Daten. Ein Wirtschaftswissenschaftler kann beispielsweise die Hypothese aufstellen, dass mit steigendem Einkommen auch die Ausgaben einer Person steigen.
Wenn die Daten zeigen, dass ein solcher Zusammenhang besteht, kann eine Regressionsanalyse durchgeführt werden, um die Stärke des Zusammenhangs zwischen Einkommen und Verbrauch zu ermitteln und um festzustellen, ob dieser Zusammenhang statistisch signifikant ist, d. h. ob es unwahrscheinlich ist, dass er allein auf Zufall zurückzuführen ist.
Beachten Sie, dass Sie mehrere erklärende Variablen in Ihre Analyse einbeziehen können – zum Beispiel Veränderungen des BIP und der Inflation zusätzlich zur Arbeitslosigkeit, um die Aktienkurse zu erklären. Wenn mehr als eine erklärende Variable verwendet wird, spricht man von einer multiplen linearen Regression. Dies ist das in der Ökonometrie am häufigsten verwendete Instrument.
Die Ökonometrie wird manchmal dafür kritisiert, dass sie sich zu sehr auf die Interpretation von Regressionsergebnissen verlässt, ohne diese mit der Wirtschaftstheorie zu verknüpfen oder nach kausalen Mechanismen zu suchen. Entscheidend ist, dass die in den Daten aufgedeckten Befunde durch eine Theorie angemessen erklärt werden können, selbst wenn dies bedeutet, dass man eine eigene Theorie der zugrunde liegenden Prozesse entwickelt.
Beispiel für die Verwendung der Regressionsanalyse im Finanzwesen
Die Regression wird häufig verwendet, um festzustellen, wie viele spezifische Faktoren wie z. B. der Preis eines Rohstoffs, Zinssätze, bestimmte Branchen oder Sektoren die Preisbewegung eines Vermögenswerts beeinflussen. Das bereits erwähnte CAPM basiert auf der Regression und wird verwendet, um die erwarteten Renditen für Aktien zu prognostizieren und die Kapitalkosten zu ermitteln. Die Renditen einer Aktie werden mit den Renditen eines breiter gefassten Index, z. B. des S&P 500, regressiert, um ein Beta für die jeweilige Aktie zu ermitteln.
Beta ist das Risiko der Aktie im Verhältnis zum Markt oder Index und spiegelt sich als Steigung im CAPM-Modell wider. Die Rendite der betreffenden Aktie wäre die abhängige Variable Y, während die unabhängige Variable X die Marktrisikoprämie wäre.
Zusätzliche Variablen wie die Marktkapitalisierung einer Aktie, Bewertungskennzahlen und die jüngsten Renditen können dem CAPM-Modell hinzugefügt werden, um bessere Schätzungen für die Renditen zu erhalten. Diese zusätzlichen Faktoren werden als Fama-French-Faktoren bezeichnet, benannt nach den Professoren, die das Modell der multiplen linearen Regression zur besseren Erklärung der Renditen von Vermögenswerten entwickelt haben.
Warum nennt man es Regression?
Obwohl der Ursprung des Namens umstritten ist, wurde die oben beschriebene statistische Technik höchstwahrscheinlich von Sir Francis Galton im 19. Jahrhundert als «Regression» bezeichnet, um die statistische Eigenschaft biologischer Daten (wie z. B. die Körpergröße von Menschen in einer Population) zu beschreiben, sich auf einen Mittelwert zurückzubilden. Mit anderen Worten: Es gibt zwar kleinere und größere Menschen, aber nur Ausreißer sind sehr groß oder sehr klein, und die meisten Menschen bewegen sich irgendwo um den Durchschnitt herum (oder «regredieren» zu diesem).
Was ist der Zweck der Regression?
In der statistischen Analyse wird die Regression verwendet, um die Assoziationen zwischen Variablen, die in bestimmten Daten vorkommen, zu ermitteln. Sie kann sowohl das Ausmaß einer solchen Assoziation aufzeigen als auch ihre statistische Signifikanz bestimmen (d. h., ob die Assoziation wahrscheinlich auf einen Zufall zurückzuführen ist oder nicht). Die Regression ist ein leistungsfähiges Instrument für statistische Schlussfolgerungen und wurde auch verwendet, um zu versuchen, zukünftige Ergebnisse auf der Grundlage vergangener Beobachtungen vorherzusagen.
Wie interpretiert man ein Regressionsmodell?
Das Ergebnis eines Regressionsmodells kann die Form Y = 1,0 + (3,2)X1 – 2,0(X2) + 0,21 haben.
Hier haben wir eine multiple lineare Regression, die eine Variable Y mit zwei erklärenden Variablen X1 und X2 in Beziehung setzt. Wir würden das Modell so interpretieren, dass sich der Wert von Y um das 3,2-fache ändert, wenn sich X1 (wenn X1 um 2 steigt, steigt Y um 6,4 usw.) bei sonst gleichen Bedingungen (bei sonst gleichen Bedingungen). Das heißt, wenn man X2 kontrolliert, hat X1 diese beobachtete Beziehung. Ebenso ist, wenn man X1 konstant hält, jede Erhöhung von X2 um eine Einheit mit einem 2x Rückgang von Y verbunden. Wir können auch den y-Achsenabschnitt von 1,0 feststellen, was bedeutet, dass Y = 1 ist, wenn X1 und X2 beide null sind. Der Fehlerterm (Residuum) ist 0,21.
Was sind die Annahmen, die für Regressionsmodelle gelten müssen?
Um die Ergebnisse eines Regressionsmodells richtig interpretieren zu können, müssen die folgenden Hauptannahmen über den zugrunde liegenden Datenprozess des zu analysierenden Sachverhalts zutreffen:
- Die Beziehung zwischen den Variablen ist linear
- Homoskedastizität, d. h. die Varianz der Variablen und der Fehlerterm müssen konstant bleiben
- Alle erklärenden Variablen sind unabhängig voneinander
- Alle Variablen sind normal verteilt