Kapitel 9: Grundlagen der Ökonometrie

Die Volkswirtschaftslehre erhebt kausale Ansprüche — Mindestlöhne beeinflussen die Beschäftigung, Bildung erhöht das Einkommen, Institutionen bestimmen das Wachstum. Die Überprüfung dieser Ansprüche erfordert Daten und eine Methode zur Unterscheidung von Kausalität und Korrelation. Ökonometrie ist diese Methode.

Dieses Kapitel ist kein Statistikkurs. Wir setzen Vertrautheit mit grundlegender Wahrscheinlichkeitsrechnung und Regression voraus. Stattdessen konzentrieren wir uns auf das zentrale Problem der empirischen Ökonomie: Identifikation — das Finden glaubwürdiger Quellen exogener Variation, die es uns ermöglichen, kausale Effekte zu schätzen. Jedes Werkzeug in diesem Kapitel — OLS, Instrumentalvariablen, Differenz-von-Differenzen, Regressionsdiskontinuität — ist eine Strategie zur Lösung des Identifikationsproblems.

Voraussetzungen: Kapitel 2 und 5 (ökonomischer Kontext für Beispiele). Mathematische Voraussetzungen: Lineare Algebra, Wahrscheinlichkeitsrechnung und Statistik.

9.1 Das Identifikationsproblem

Betrachten Sie die Frage: Erhöht ein zusätzliches Jahr Bildung das Einkommen? Wir beobachten, dass besser gebildete Menschen mehr verdienen. Aber liegt das daran, dass:

Beides ist mit der beobachteten Korrelation vereinbar. Das Identifikationsproblem besteht darin, dass wir dieselbe Person nicht direkt mit und ohne Bildung vergleichen können — das Kontrafaktische ist unbeobachtet.

wobei $Y_i$ das Ergebnis (Einkommen) ist, $X_i$ die Behandlung (Bildungsjahre), $\beta$ der kausale Parameter von Interesse und $\varepsilon_i$ alles andere erfasst, was $Y_i$ beeinflusst — Fähigkeit, familiärer Hintergrund, Motivation, Glück, Gesundheit und Tausende anderer Faktoren.

Das Identifikationsproblem entsteht, wenn $X_i$ mit $\varepsilon_i$ korreliert ist — wenn die „Behandlung“ nicht zufällig zugewiesen wird. In der Statistik wird dies als Endogenität bezeichnet. In der Ökonomie ist es die Norm, nicht die Ausnahme: Menschen wählen ihre Bildung (und die Wahl korreliert mit der Fähigkeit), Länder wählen ihre Politiken (und die Wahl korreliert mit ihren wirtschaftlichen Bedingungen), Unternehmen wählen ihre Preise (und die Wahl korreliert mit den Nachfragebedingungen).

In einem randomisierten Experiment wird die Behandlung $X_i$ per Münzwurf zugewiesen — sie ist konstruktionsbedingt unabhängig von $\varepsilon_i$. Aber Ökonomen haben selten den Luxus der Randomisierung bei den großen Fragen. Die Methoden in diesem Kapitel — OLS, IV, DiD, RD — sind Strategien, um „natürliche Experimente“ zu finden, die die Randomisierung in Beobachtungsdaten approximieren.

9.2 Gewöhnliche Methode der kleinsten Quadrate (OLS)

Unter diesen Annahmen ist OLS BLUE — der beste lineare unverzerrte Schätzer. „Best“ bedeutet niedrigste Varianz unter allen linearen unverzerrten Schätzern. „Unverzerrt“ bedeutet $E[\hat{\beta}] = \beta$.

Die kritische Annahme ist Nr. 4: $E[\varepsilon|X] = 0$. Wenn diese versagt — aufgrund ausgelassener Variablen, Simultanität oder Messfehler in $X$ — ist OLS verzerrt. Die Schätzung $\hat{\beta}$ konvergiert selbst bei unendlich vielen Daten nicht mehr zum wahren $\beta$. Dies ist kein Kleinproben-Problem — es ist ein grundlegender Designfehler, den mehr Daten nicht beheben können.

Abbildung 9.1 — OLS-Regressions-Explorer

Ein Streudiagramm mit einer angepassten OLS-Regressionslinie. Ziehen Sie den Schieberegler, um einen Ausreißer an verschiedenen vertikalen Positionen hinzuzufügen, und beobachten Sie, wie die Regressionslinie kippt. Beobachten Sie, wie ein einzelner Punkt mit hohem Hebeleffekt die Steigung, $R^2$ und Koeffizienten dramatisch verändern kann.

Ausreißer Y-Position: Keiner

Kein Ausreißer Moderat Extrem (Y=25)

OLS: β̂ = 0.00 | Intercept = 0.00 | R² = 0.00

Abbildung 9.1. OLS-Regression mit einem einstellbaren Ausreißer. Der Ausreißer befindet sich bei $X=14$ (hoher Hebeleffekt). Ziehen Sie den Schieberegler über „Kein Ausreißer“, um ihn einzuführen, und beobachten Sie, wie die Linie kippt. Hover für Werte.

Verzerrung durch ausgelassene Variablen

Angenommen, das wahre Modell ist $Y = \beta_0 + \beta_1 X + \beta_2 Z + u$, aber wir lassen $Z$ aus und schätzen $Y = \alpha_0 + \alpha_1 X + e$. Dann:

Die Verzerrung entspricht dem Effekt der ausgelassenen Variablen ($\beta_2$) multipliziert mit der Assoziation zwischen der ausgelassenen Variablen und dem eingeschlossenen Regressor.

	$Cov(X, Z) > 0$	$Cov(X, Z) < 0$
$\beta_2 > 0$	Aufwärtsverzerrung (Überschätzung von $\beta_1$)	Abwärtsverzerrung
$\beta_2 < 0$	Abwärtsverzerrung	Aufwärtsverzerrung

Abbildung 9.2 — Verzerrung durch ausgelassene Variablen

Zwei Panels zeigen dieselben Daten. Links: die wahre Beziehung mit dem Störfaktor (Fähigkeit), dargestellt als Punktfarbe. Rechts: die naive OLS-Regression ohne Fähigkeit. Ziehen Sie den Schieberegler, um die Stärke des Störfaktors zu ändern, und beobachten Sie, wie die Verzerrung wächst.

Konfundierungsstärke ($\rho$): 0,60

Keine Konfundierung (0) Moderat (0,5) Stark (0,95)

True β₁ = 0.50 | Naive OLS β̂ = 0.00 | Bias = 0.00

Links: Wahres Modell mit dem Störfaktor (Fähigkeit), dargestellt als Farbe. Dunkler = höhere Fähigkeit.

Rechts: Naive OLS-Regression ohne Berücksichtigung der Fähigkeit. Die verzerrte Linie (rot gestrichelt) ist steiler als der wahre kausale Effekt (blau).

9.3 Instrumentalvariablen (IV)

Wenn OLS verzerrt ist, weil $X$ endogen ist ($Cov(X, \varepsilon) \neq 0$), kann eine Instrumentalvariable die Schätzung retten.

Dies isoliert den Teil von $X$, der vom Instrument angetrieben wird — den exogenen Teil. Die angepassten Werte $\hat{X}_i$ repräsentieren die „saubere“ Variation in $X$.

Die IV-Schätzung ist das Verhältnis der reduzierten Form (Effekt von $Z$ auf $Y$) zur ersten Stufe (Effekt von $Z$ auf $X$). Die Intuition: $Z$ beeinflusst $Y$ nur über $X$ (Ausschlussrestriktion), daher isoliert die Division durch die erste Stufe den kausalen Effekt von $X$ auf $Y$.

Was IV schätzt. Bei heterogenen Behandlungseffekten identifiziert IV den lokalen durchschnittlichen Behandlungseffekt (LATE) — den kausalen Effekt für die Teilpopulation, deren Verhalten durch das Instrument verändert wird (die „Complier“).

Schwache Instrumente

Wenn $Z$ schwach mit $X$ korreliert ist, ist die erste Stufe schwach und die IV-Schätzung unzuverlässig (verzerrt in Richtung OLS, breite Konfidenzintervalle). Faustregel: F-Statistik der ersten Stufe > 10.

9.4 Differenz-von-Differenzen (DiD)

Die erste Differenz beseitigt zeitinvariante Gruppenmerkmale. Die zweite Differenz beseitigt gemeinsame Zeittrends.

Schlüsselannahme: Parallele Trends. In Abwesenheit der Behandlung hätten Behandlungs- und Kontrollgruppe demselben Trend gefolgt. Dies ist für die Nachbehandlungsperiode nicht testbar, aber für die Vorbehandlungsperiode beurteilbar.

Abbildung 9.3 — Differenz-von-Differenzen

Zwei Zeitreihen zeigen eine Behandlungs- und eine Kontrollgruppe. Die Behandlung erfolgt bei $t = 5$. Ziehen Sie den Schieberegler, um die Größe des Behandlungseffekts zu ändern, und beobachten Sie, wie sich die DiD-Schätzung aktualisiert. Parallele Trends vor der Behandlung sind sichtbar.

Behandlungseffekt ($\tau$): 3,0

Negativ (−5) Null Groß (+10)

DiD estimate: τ̂ = 3.00

Abbildung 9.3. Differenz-von-Differenzen-Design. Die gestrichelte Linie zeigt das Kontrafaktische — was mit der Behandlungsgruppe ohne Behandlung passiert wäre (parallel zur Kontrolle). Die Lücke zwischen den tatsächlichen und kontrafaktischen Ergebnissen am Ende ist der Behandlungseffekt.

9.5 Regressionsdiskontinuität (RD)

Schlüsselannahme: Stetigkeit. Alle Faktoren, die $Y$ beeinflussen (außer der Behandlung), variieren stetig am Schwellenwert — keine Sortierung oder Manipulation um den Schwellenwert.

Abbildung 9.4 — Regressionsdiskontinuität

Ein Streudiagramm mit einer Laufvariablen (Testergebnis). Studierende oberhalb des Schwellenwerts erhalten die Behandlung (Stipendium). Polynom-Anpassungen auf jeder Seite zeigen den Sprung am Schwellenwert. Passen Sie die Position des Schwellenwerts und die Bandbreite an, um zu sehen, wie sich der geschätzte Behandlungseffekt ändert.

Schwellenwertposition: 50

Niedrig (30) Mitte (50) Hoch (70)

Bandbreite: 25

Schmal (5) Mittel (25) Breit (40)

RD estimate: τ̂ = 0.00 | Cutoff = 50 | Bandwidth = 25

Abbildung 9.4. Regressionsdiskontinuität. Die vertikale gestrichelte Linie markiert den Schwellenwert. Punkte links des Schwellenwerts sind unbehandelt (grau); rechts sind behandelt (grün). Der Sprung am Schwellenwert ist die Schätzung des Behandlungseffekts. Passen Sie die Bandbreite an, um sich auf Beobachtungen nahe dem Schwellenwert zu konzentrieren.

9.6 Randomisierte kontrollierte Studien (RCTs)

RCTs sind der „Goldstandard“ für interne Validität, da die Randomisierung konstruktionsbedingt $E[\varepsilon|X] = 0$ garantiert. Banerjee, Duflo und Kremer erhielten 2019 den Nobelpreis für ihren experimentellen Ansatz zur Bekämpfung globaler Armut.

Grenzen der RCTs

Beispiel 9.5 — RCT mit partieller Compliance

Ein Berufsausbildungsprogramm weist 500 Personen zufällig der Behandlungsgruppe und 500 der Kontrollgruppe zu. Nur 60 % der zur Behandlung Zugewiesenen nehmen tatsächlich am Programm teil (Compliance-Rate = 0,6).

Ergebnisse: Durchschnittliches Einkommen: Behandlungsgruppe = 25.000 $, Kontrollgruppe = 23.000 $.

ITT: $\hat{\tau}_{ITT} = 25{,}000 - 23{,}000 = \\$1{,}000$. Dies ist der Effekt des Angebots des Programms.

TOT: $\hat{\tau}_{TOT} = 2{,}000 / 0.6 = \\$1{,}333$. Dies schätzt den Effekt der tatsächlichen Teilnahme am Programm (für Complier). Der TOT ist größer, da der ITT durch Nicht-Complier verdünnt wird.

Teststärke-Prüfung: Mit $n = 500$ pro Gruppe, $\sigma = \\$1{,}000$ und einem wahren Effekt von $\\$1{,}000$ beträgt die Teststärke $\approx 0.80$. Die Studie ist ausreichend gepowert, um den ITT zu erkennen.

Abbildung 9.5 — RCT-Teststärkerechner

Statistische Teststärke ist die Wahrscheinlichkeit, einen wahren Behandlungseffekt zu erkennen. Verwenden Sie die Schieberegler, um zu erkunden, wie Effektgröße, Stichprobengröße und Varianz die Teststärke beeinflussen. Die Teststärkekurve aktualisiert sich in Echtzeit, und der minimale erkennbare Effekt (MDE) bei 80 % Teststärke wird hervorgehoben.

Wahre Effektgröße ($\delta$): 0,50

Klein (0,05) Mittel (0,50) Groß (1,50)

Stichprobengröße pro Gruppe ($n$): 100

10 250 500

Standardabweichung ($\sigma$): 1,00

Niedrig (0,5) Mittel (1,0) Hoch (3,0)

Power: 0.00 | MDE at 80% power: 0.00

Abbildung 9.5. Teststärkekurve: Wahrscheinlichkeit, den Effekt zu erkennen, als Funktion der Effektgröße. Die rote gestrichelte Linie markiert 80 % Teststärke. Die grüne Raute markiert die aktuelle Parameterkombination. Der MDE ist der kleinste erkennbare Effekt bei 80 % Teststärke bei gegebener Stichprobengröße und Varianz.

9.7 Standardfehler und Inferenz

Standardfehler (SE) sind die Quadratwurzeln der Diagonalelemente. Ein 95%-Konfidenzintervall beträgt ungefähr $\hat{\beta} \pm 1.96 \cdot SE(\hat{\beta})$.

Statistische Signifikanz: Wir lehnen $H_0: \beta = 0$ auf dem 5%-Niveau ab, wenn $|t| = |\hat{\beta}/SE(\hat{\beta})| > 1.96$.

Ökonomische Signifikanz vs. statistische Signifikanz: Ein Koeffizient kann statistisch signifikant, aber ökonomisch trivial sein. Umgekehrt kann eine unpräzise Schätzung ökonomisch groß, aber statistisch insignifikant sein. Gute empirische Arbeit diskutiert beides.

Bedrohungen für valide Inferenz

Eine praktische Regel: In der modernen angewandten Ökonomie sollten Sie immer robuste oder geclusterte Standardfehler verwenden.

9.8 Bedrohungen der Validität

Strategie	Schlüsselannahme	Bedrohung	Diagnostik
OLS	Keine ausgelassenen Variablen ($E[\varepsilon\|X]=0$)	Konfundierung	Theorie + Sensitivitätsanalyse
IV	Ausschlussrestriktion	Direkter Effekt von $Z$ auf $Y$	Nicht direkt testbar; theoretisch argumentieren
IV	Relevanz	Schwache Instrumente	F der ersten Stufe > 10
DiD	Parallele Trends	Unterschiedliche Vorbehandlungstrends	Vorbehandlungstrends grafisch darstellen
RD	Keine Manipulation am Schwellenwert	Sortierung um den Schwellenwert	McCrary-Dichtetest
RCT	Keine Attrition, keine Spillover	Differenzieller Abbruch; Kontamination	Balance-Checks, Attritionsanalyse

Beispiel-Faden: Die Republik Kaelani

Ein Ökonom möchte den Effekt von Kaelanis neuer Bildungspolitik (kostenlose Schulbücher für die Klassen 1–6) auf die Testergebnisse schätzen. Die Politik wurde 2024 in den östlichen Provinzen eingeführt, aber nicht in den westlichen.

Design: Differenz-von-Differenzen.

	Vor der Politik (2023)	Nach der Politik (2025)	Veränderung
Osten (Behandlung)	55	63	+8
Westen (Kontrolle)	52	56	+4
DiD-Schätzung			+4

Die DiD-Schätzung beträgt 4 Punkte. Kostenlose Schulbücher haben die Testergebnisse um 4 Punkte erhöht, nach Kontrolle des gemeinsamen Aufwärtstrends.

Bedrohungen: (1) Parallele Trends: Verbesserten sich die östlichen Provinzen bereits schneller? (2) Spillover-Effekte: Schickten Familien nahe der Grenze ihre Kinder in östliche Schulen? (3) Zusammensetzungsänderungen: Veränderten kostenlose Schulbücher die Einschreibungen?

Ein ergänzender Ansatz: Regressionsdiskontinuität an der Provinzgrenze, mit Vergleich von Dörfern direkt auf beiden Seiten.

Zusammenfassung

Das Identifikationsproblem — die Unterscheidung von Kausalität und Korrelation — ist die zentrale Herausforderung der empirischen Wirtschaftswissenschaft.
OLS schätzt lineare Beziehungen, ist aber verzerrt, wenn die erklärenden Variablen mit dem Fehlerterm korreliert sind. Die Verzerrung durch ausgelassene Variablen hat eine vorhersagbare Richtung.
Instrumentalvariablen isolieren exogene Variation mithilfe einer Variablen, die mit $X$ korreliert, aber nicht direkt mit $Y$. Die Ausschlussrestriktion ist entscheidend und nicht testbar.
Differenz-von-Differenzen vergleicht Veränderungen über die Zeit zwischen Behandlungs- und Kontrollgruppe unter der Annahme paralleler Trends.
Regressionsdiskontinuität nutzt Schwellenwerte in laufenden Variablen, um lokale Quasi-Experimente zu schaffen.
RCTs lösen das Identifikationsproblem durch Design, sind aber in der externen Validität begrenzt.
Jede Strategie hat Annahmen und Bedrohungen. Gute empirische Arbeit legt ihre Identifikationsstrategie klar dar und adressiert potenzielle Verletzungen.

Wichtige Gleichungen

Bezeichnung	Gleichung	Beschreibung
Gl. 9.1	$Y_i = \alpha + \beta X_i + \varepsilon_i$	Strukturgleichung
Gl. 9.2	$\hat{\beta}_{OLS} = (X'X)^{-1}X'Y$	OLS-Schätzer
Gl. 9.3	$E[\hat{\alpha}_1] = \beta_1 + \beta_2 \cdot Cov(X,Z)/Var(X)$	Formel der Verzerrung durch ausgelassene Variablen
Gl. 9.5	$\hat{\beta}_{IV} = Cov(Z,Y)/Cov(Z,X)$	IV-Schätzer (einfach)
Gl. 9.6	$\hat{\tau}_{DiD}$ = (treat change) − (control change)	DiD-Schätzer
Gl. 9.7	$Y_{it} = \alpha + \beta_1 Treat + \beta_2 Post + \tau(Treat \times Post) + \varepsilon$	DiD-Regression
Gl. 9.8	$\hat{\tau}_{RD} = \lim_{x \downarrow c} E[Y\|X=x] - \lim_{x \uparrow c} E[Y\|X=x]$	RD-Schätzer
Gl. 9.9	$\hat{\tau}_{RCT} = \bar{Y}_{treat} - \bar{Y}_{control}$	RCT-Schätzer
Gl. 9.10	$Var(\hat{\beta}) = \sigma^2(X'X)^{-1}$	OLS-Varianz

Übungen

Übung

Angenommen, Sie regressieren Löhne auf Bildungsjahre mit OLS und schätzen einen Koeffizienten von 0,10 (jedes Bildungsjahr ist mit 10 % höheren Löhnen verbunden). Nennen Sie zwei ausgelassene Variablen, die diese Schätzung verzerren könnten, und sagen Sie die Richtung der Verzerrung für jede voraus.
Eine IV-Studie verwendet die „Entfernung zum nächsten College“ als Instrument für die Schuljahre. (a) Argumentieren Sie für die Relevanz. (b) Was ist die Ausschlussrestriktion, und was könnte sie verletzen?
Zwei Städte werden vor und nach der Einführung einer Limonadensteuer in Stadt A verglichen. Vor der Steuer betrug der Limonadenkonsum in Stadt A 100 Dosen/Person und in Stadt B 90. Nach der Steuer beträgt der Konsum 80 in A und 85 in B. Berechnen Sie die DiD-Schätzung. Was ist hier die Annahme paralleler Trends?
Ein Stipendienprogramm nimmt Studierende mit einem Notendurchschnitt ≥ 3,5 auf. Sie haben Daten über Studierende mit Notendurchschnitten von 3,0 bis 4,0. (a) Beschreiben Sie das RD-Design. (b) Was ist die Laufvariable? (c) Welche Annahme muss bezüglich des Verhaltens der Studierenden nahe dem Schwellenwert gelten?

Anwendung

Eine Regierung randomisiert den Zugang zu einem Berufsausbildungsprogramm. 60 % derjenigen, denen das Programm angeboten wird, nehmen tatsächlich teil. Die Intention-to-Treat-Schätzung beträgt eine Einkommenserhöhung von 500 $. Wie hoch ist die Treatment-on-Treated-Schätzung? Welche Annahme benötigen Sie, und wie hängt dies mit IV zusammen?
Ein Ökonom behauptet, dass Demokratie Wirtschaftswachstum verursacht, und zitiert Länderquerschnitts-Korrelationen. Kritisieren Sie diese Behauptung anhand des Rahmens dieses Kapitels. Welche spezifische Identifikationsstrategie würden Sie vorschlagen?
Eine DiD-Studie schätzt den Effekt einer Umweltregulierung. Vorbehandlungstrends zeigen, dass die Verschmutzung der Behandlungsgruppe bereits schneller sank als die der Kontrollgruppe. Wie verletzt dies parallele Trends? In welche Richtung ist die DiD-Schätzung verzerrt?

Herausforderung

Leiten Sie den OLS-Schätzer $\hat{\beta} = (X'X)^{-1}X'Y$ her, indem Sie $S(\beta) = (Y - X\beta)'(Y - X\beta)$ minimieren. Zeigen Sie, dass die Bedingung erster Ordnung die Normalgleichungen $X'X\hat{\beta} = X'Y$ ergibt.
Zeigen Sie algebraisch, dass wenn das Instrument $Z$ binär ist, der IV-Schätzer sich zum Wald-Schätzer vereinfacht: $\hat{\beta}_{IV} = (\bar{Y}_1 - \bar{Y}_0)/(\bar{X}_1 - \bar{X}_0)$.
Diskutieren Sie die „Glaubwürdigkeitsrevolution“ in der Ökonomie (Angrist und Pischke, 2010). Was hat sich zwischen der Strukturökonometrie und der designbasierten empirischen Arbeit verändert? Was sind die Stärken und Grenzen jedes Ansatzes?

Kapitel 9Grundlagen der Ökonometrie

Einleitung