Regression mit stochastischen Regressoren

Bei der Regression mit stochastischen Regressoren handelt es sich um spezielle statistische Analyseverfahren zur Aufdeckung möglicher Abhängigkeiten einer statistischen Größe von anderen Größen, den sogenannten Regressoren. In klassischen Regressionsmodellen (z. B. einfache lineare Regression, multiple lineare Regression) wird in der Regel angenommen, dass die Regressoren nichtzufällige, häufig sogar einstellbare Größen sind. In vielen praktischen Fällen, insbesondere bei ökonometrischen Modellen, kann diese Annahme nicht beibehalten werden. Man muss von zufälligen, also stochastischen Regressoren ausgehen. Dabei ist insbesondere von Interesse, wie sich stochastische Regressoren auf die Eigenschaften der Schätzungen (z. B. Kleinste-Quadrate-Schätzer) und Signifikanztests auswirken. Kurz gesagt ist es so, dass die für klassische Regressionsmodelle bekannten Eigenschaften (zumindest näherungsweise) erhalten bleiben, solange die stochastischen Regressoren unkorreliert mit den Störtermen sind (es liegt sogenannte Exogenität vor). Sind sie allerdings korreliert (es liegt sogenannte Endogenität vor), dann muss man prinzipiell andere Wege gehen.

Beispiele

Bearbeiten

Autoregressiver Prozess erster Ordnung (AR(1))

Bearbeiten

Der autoregressive Prozess erster Ordnung ist ein einfaches Modell der Zeitreihenanalyse und hat die Form

 ,

wobei   weißes Rauschen darstellt. Der Regressor zum Zeitpunkt   ist der zufällige Regressand vom Zeitpunkt  .

Fehler-in-den-Variablen-Modell

Bearbeiten

Gegeben sei im einfachsten Fall ein einfaches lineares Regressionsmodell (siehe z: B.[1]):

 ,

jedoch kann   nur mit zufälligem Fehler   beobachtet werden, d. h. man hat dann den stochastischen Regressor  . Solche Modelle nennt man Fehler-in-den-Variablen-Modelle.

Simultane Gleichungen

Bearbeiten

Als Beispiel betrachte man die keynesianische Konsumfunktion mit zwei simultanen Gleichungen (siehe z. B.[2]):

 

Dabei ist   der Konsum,   das Einkommen und   die Investition. Setzt man die erste Gleichung in die zweite ein, ergibt sich:

 ,

d. h.   ist zufällig, weil es von   abhängt.

Allgemeiner Fall

Bearbeiten

Wir betrachten ein multiples lineares Regressionsmodell in Vektor-Matrix-Form

 .

Dabei ist   der  -dimensionale zufällige Vektor der Regressanden,   die  -Matrix der Regressoren,   der  -dimensionale zu schätzende Parametervektor und   der  -dimensionale zufällige Vektor der Störgrößen mit   und  . Hierbei wird angenommen, dass die Datenmatrix   mit Wahrscheinlichkeit 1 vollen Rang hat, d. h.  . Der Kleinste-Quadrate-Schätzer für   hat die Gestalt

 .

Da man schreiben kann  , mit  , ist   eine lineare Funktion der Störgrößen, was   zu einem linearen Schätzer macht.

Nichtzufällige Regressoren

Bearbeiten

In diesem Standardfall gilt bekanntermaßen

  •   ist beste lineare erwartungstreue Schätzfunktion (BLUE) mit  .
  • Falls das durchschnittliche Quadrat der beobachteten Werte der erklärenden Variablen auch bei einem ins Unendliche gehendem Stichprobenumfang endlich bleibt:   mit positiv definitem  , dann ist   konsistent für  .
  • Falls die Störgröße normalverteilt ist, dann ist auch   normalverteilt und es können t- bzw. F-verteilte Teststatistiken gebildet werden.

Exogenität der Regressoren

Bearbeiten

Darunter versteht man, dass die Regressoren   zwar stochastisch, aber unkorreliert mit dem Störterm   sind, siehe z. B.[3] Im obigen Fehler-in-den-Variablen-Beispiel hat man die Exogenität, wenn   und   unkorreliert sind. Dann gilt:

  •   ist weiterhin BLUE mit  , siehe [4]
  • Falls   in Wahrscheinlichkeit gegen eine positiv definite Matrix   konvergiert, dann ist   konsistent für  , siehe z. B.[5]
  • Falls   normalverteilt ist, dann ist   asymptotisch normalverteilt. Die klassischen Teststatistiken können für große   benutzt werden.

Allgemeine stochastische Regressoren

Bearbeiten

  und   sind korreliert, wie z. B. bei der keynesianischen Konsumfunktion. Dann ist   verzerrt und nicht mehr konsistent für  . Die klassischen Teststatistiken können nicht benutzt werden. Es müssen prinzipiell andere Methoden gewählt werden.

Für Modelle der Zeitreihenanalyse, wenn allgemeiner als im obigen AR(1)-Beispiel ein ARMA-Modell vorliegt, gibt es spezielle, zum Teil rekursive Kleinste-Quadrate-Verfahren, die im Allgemeinen auf nichtlineare Kleinste-Quadrate-Schätzer führen, siehe z. B.[6]

Unter dem Stichwort Simultane Gleichungen findet man die Methode der Instrumentvariablen, und da z. B. den zweistufigen Kleinste-Quadrate-Schätzer (engl. two-stage least-squares estimator) und den mit der verallgemeinerten Momentenmethode (engl. Generalized Method of Moments) gewonnenen Schätzer GMM-Schätzer, siehe z. B.[7]

Einzelnachweise

Bearbeiten
  1. Schneeweiß, H.: Ökonometrie, Physica Verlag 1990 (4. Auflage) Kapitel 7 (3. Auflage 1978)
  2. Schönfeld, P.: Methoden der Ökonometrie, Band II, Stochastische Regressoren und simultane Gleichungen, Vahlen (München) 1971
  3. Green, W.H.: Econometric Analysis, Prentice Hall 2002 (5. Auflage), Seite 42, full text
  4. Green, W.H.: Econometric Analysis, Prentice Hall 2002 (5. Auflage), Theorem 4.3
  5. Verbeek, M.: A Guide to Modern Econometrics, Wiley 2004 (2. Auflage), Seite 34, full text
  6. Brockwell, P. J. and Davis, R. A.: Time Series: Theory and Methods, Springer 1991 (2. Auflage)
  7. Green, W.H.: Econometric Analysis, Prentice Hall 2002 (5. Auflage), Kapitel 15