18  Regresión Discontinua

Temas a revisar:

 


TipPróximamente

Los apuntes detallados sobre RDD se encuentran en preparación.


18.1 Idea general

El Diseño de Regresión Discontinua (RDD) explota un salto discontinuo en la probabilidad de recibir tratamiento en un umbral conocido \(c\) de una variable de asignación continua \(X_i\):

\[ D_i = \mathbf{1}[X_i \geq c] \]

Idea central: las unidades ubicadas justo por debajo y justo por encima del punto de corte son, en promedio, comparables. Por tanto, cualquier salto discontinuo en el resultado \(Y_i\) en torno a \(c\) puede atribuirse al tratamiento.


18.2 RDD sharp

En el RDD sharp, el tratamiento es una función determinística de \(X_i\): \(D_i = \mathbf{1}[X_i \geq c]\).

El parámetro de interés es el Efecto Causal Local Promedio en el umbral: \[ \tau_{RDD} = \lim_{x \downarrow c} E[Y_i \mid X_i=x] - \lim_{x \uparrow c} E[Y_i \mid X_i=x] \]

Supuesto de identificación: \(E[Y_i(0)\mid X_i=x]\) y \(E[Y_i(1)\mid X_i=x]\) son continuos en \(x\) en \(c\).


18.3 RDD fuzzy

En el RDD fuzzy, cruzar el umbral modifica la probabilidad de recibir el tratamiento, pero no lo determina de forma perfecta. En este caso, el estimador RDD puede interpretarse como un estimador de variables instrumentales, usando \(\mathbf{1}[X_i \geq c]\) como instrumento para \(D_i\):

\[ \tau_{Fuzzy} = \frac{\lim_{x\downarrow c}E[Y_i\mid X_i=x] - \lim_{x\uparrow c}E[Y_i\mid X_i=x]}{\lim_{x\downarrow c}P(D_i=1\mid X_i=x) - \lim_{x\uparrow c}P(D_i=1\mid X_i=x)} \]


18.4 Estimación

Regresión lineal local

Se estiman regresiones lineales separadas a cada lado del umbral dentro de una ventana o bandwidth \(h\):

\[ Y_i = \alpha + \tau D_i + \beta_1(X_i - c) + \beta_2 D_i(X_i-c) + \varepsilon_i \quad \text{para } |X_i - c| \leq h \]

La regresión lineal local, ponderada mediante un kernel, suele preferirse frente a polinomios globales porque presenta mejores propiedades en la frontera.

Selección de bandwidth

El bandwidth óptimo equilibra sesgo y varianza: un bandwidth grande reduce varianza pero puede aumentar el sesgo por aproximación lineal, mientras que uno pequeño reduce sesgo pero utiliza menos observaciones. Calonico, Cattaneo y Titiunik (2014) proponen procedimientos basados en datos junto con inferencia corregida por sesgo.


18.5 Pruebas de validez

  • Test de densidad de McCrary: evalúa si existe manipulación de la variable de asignación en torno a \(c\); idealmente no debería observarse un salto en la densidad
  • Suavidad de covariables pretratamiento: verifica que las covariables de base evolucionen suavemente alrededor de \(c\)
  • Puntos de corte placebo: evalúan si aparecen saltos en valores distintos del umbral verdadero

18.6 Referencias

Imbens, G. W. and Lemieux, T. (2008). “Regression Discontinuity Designs: A Guide to Practice.” Journal of Econometrics, 142(2), 615–635.

Calonico, S., Cattaneo, M. D. and Titiunik, R. (2014). “Robust Nonparametric Confidence Intervals for Regression-Discontinuity Designs.” Econometrica, 82(6), 2295–2326.

Key idea: Units just below and just above the cutoff are similar on average. Any discontinuous jump in the outcome \(Y_i\) at \(c\) can be attributed to the treatment.


18.7 Sharp RDD

In the sharp RDD, treatment is a deterministic function of \(X_i\): \(D_i = \mathbf{1}[X_i \geq c]\).

The estimand is the Local Average Treatment Effect at the threshold: \[\tau_{RDD} = \lim_{x \downarrow c} E[Y_i \mid X_i=x] - \lim_{x \uparrow c} E[Y_i \mid X_i=x]\]

Identification assumption: \(E[Y_i(0)\mid X_i=x]\) and \(E[Y_i(1)\mid X_i=x]\) are continuous in \(x\) at \(c\).


18.8 Fuzzy RDD

In the fuzzy RDD, crossing the threshold changes the probability of treatment but does not determine it deterministically. The RDD estimator is an IV estimator using \(\mathbf{1}[X_i \geq c]\) as an instrument for \(D_i\):

\[\tau_{Fuzzy} = \frac{\lim_{x\downarrow c}E[Y_i\mid X_i=x] - \lim_{x\uparrow c}E[Y_i\mid X_i=x]}{\lim_{x\downarrow c}P(D_i=1\mid X_i=x) - \lim_{x\uparrow c}P(D_i=1\mid X_i=x)}\]


18.9 Estimation

Local linear regression

Estimate separate linear regressions on each side of the cutoff within a bandwidth \(h\):

\[Y_i = \alpha + \tau D_i + \beta_1(X_i - c) + \beta_2 D_i(X_i-c) + \varepsilon_i \quad \text{for } |X_i - c| \leq h\]

Local linear regression (weighted by a kernel) is preferred over polynomial regression for its better boundary properties.

Bandwidth selection

Optimal bandwidth trades off bias (from linearity approximation) and variance (from fewer observations). Calonico, Cattaneo & Titiunik (2014) provide data-driven bandwidth selection with bias-corrected inference.


18.10 Validity Checks

  • McCrary density test: test for manipulation of the running variable at \(c\) (no density jump should be present if assignment is as-good-as-random near \(c\))
  • Pre-treatment covariate smoothness: check that baseline covariates are smooth through \(c\)
  • Placebo cutoffs: test for jumps at non-threshold values

18.11 References

Imbens, G. W. and Lemieux, T. (2008). “Regression Discontinuity Designs: A Guide to Practice.” Journal of Econometrics, 142(2), 615–635.

Calonico, S., Cattaneo, M. D. and Titiunik, R. (2014). “Robust Nonparametric Confidence Intervals for Regression-Discontinuity Designs.” Econometrica, 82(6), 2295–2326.