18 Regresión Discontinua
Temas a revisar:
- RDD sharp: efecto causal local promedio en el umbral
- RDD fuzzy: interpretación como IV cuando la asignación al tratamiento es probabilística
- Estimación mediante regresión lineal local
- Selección de bandwidth basada en datos (Calonico-Cattaneo-Titiunik)
- Pruebas de validez: test de densidad de McCrary, suavidad de covariables y puntos de corte placebo
Los apuntes detallados sobre RDD se encuentran en preparación.

18.1 Idea general
El Diseño de Regresión Discontinua (RDD) explota un salto discontinuo en la probabilidad de recibir tratamiento en un umbral conocido \(c\) de una variable de asignación continua \(X_i\):
\[ D_i = \mathbf{1}[X_i \geq c] \]
Idea central: las unidades ubicadas justo por debajo y justo por encima del punto de corte son, en promedio, comparables. Por tanto, cualquier salto discontinuo en el resultado \(Y_i\) en torno a \(c\) puede atribuirse al tratamiento.
18.2 RDD sharp
En el RDD sharp, el tratamiento es una función determinística de \(X_i\): \(D_i = \mathbf{1}[X_i \geq c]\).
El parámetro de interés es el Efecto Causal Local Promedio en el umbral: \[ \tau_{RDD} = \lim_{x \downarrow c} E[Y_i \mid X_i=x] - \lim_{x \uparrow c} E[Y_i \mid X_i=x] \]
Supuesto de identificación: \(E[Y_i(0)\mid X_i=x]\) y \(E[Y_i(1)\mid X_i=x]\) son continuos en \(x\) en \(c\).
18.3 RDD fuzzy
En el RDD fuzzy, cruzar el umbral modifica la probabilidad de recibir el tratamiento, pero no lo determina de forma perfecta. En este caso, el estimador RDD puede interpretarse como un estimador de variables instrumentales, usando \(\mathbf{1}[X_i \geq c]\) como instrumento para \(D_i\):
\[ \tau_{Fuzzy} = \frac{\lim_{x\downarrow c}E[Y_i\mid X_i=x] - \lim_{x\uparrow c}E[Y_i\mid X_i=x]}{\lim_{x\downarrow c}P(D_i=1\mid X_i=x) - \lim_{x\uparrow c}P(D_i=1\mid X_i=x)} \]
18.4 Estimación
Regresión lineal local
Se estiman regresiones lineales separadas a cada lado del umbral dentro de una ventana o bandwidth \(h\):
\[ Y_i = \alpha + \tau D_i + \beta_1(X_i - c) + \beta_2 D_i(X_i-c) + \varepsilon_i \quad \text{para } |X_i - c| \leq h \]
La regresión lineal local, ponderada mediante un kernel, suele preferirse frente a polinomios globales porque presenta mejores propiedades en la frontera.
Selección de bandwidth
El bandwidth óptimo equilibra sesgo y varianza: un bandwidth grande reduce varianza pero puede aumentar el sesgo por aproximación lineal, mientras que uno pequeño reduce sesgo pero utiliza menos observaciones. Calonico, Cattaneo y Titiunik (2014) proponen procedimientos basados en datos junto con inferencia corregida por sesgo.
18.5 Pruebas de validez
- Test de densidad de McCrary: evalúa si existe manipulación de la variable de asignación en torno a \(c\); idealmente no debería observarse un salto en la densidad
- Suavidad de covariables pretratamiento: verifica que las covariables de base evolucionen suavemente alrededor de \(c\)
- Puntos de corte placebo: evalúan si aparecen saltos en valores distintos del umbral verdadero
18.6 Referencias
Imbens, G. W. and Lemieux, T. (2008). “Regression Discontinuity Designs: A Guide to Practice.” Journal of Econometrics, 142(2), 615–635.
Calonico, S., Cattaneo, M. D. and Titiunik, R. (2014). “Robust Nonparametric Confidence Intervals for Regression-Discontinuity Designs.” Econometrica, 82(6), 2295–2326.
Key idea: Units just below and just above the cutoff are similar on average. Any discontinuous jump in the outcome \(Y_i\) at \(c\) can be attributed to the treatment.
18.8 Fuzzy RDD
In the fuzzy RDD, crossing the threshold changes the probability of treatment but does not determine it deterministically. The RDD estimator is an IV estimator using \(\mathbf{1}[X_i \geq c]\) as an instrument for \(D_i\):
\[\tau_{Fuzzy} = \frac{\lim_{x\downarrow c}E[Y_i\mid X_i=x] - \lim_{x\uparrow c}E[Y_i\mid X_i=x]}{\lim_{x\downarrow c}P(D_i=1\mid X_i=x) - \lim_{x\uparrow c}P(D_i=1\mid X_i=x)}\]
18.9 Estimation
Local linear regression
Estimate separate linear regressions on each side of the cutoff within a bandwidth \(h\):
\[Y_i = \alpha + \tau D_i + \beta_1(X_i - c) + \beta_2 D_i(X_i-c) + \varepsilon_i \quad \text{for } |X_i - c| \leq h\]
Local linear regression (weighted by a kernel) is preferred over polynomial regression for its better boundary properties.
Bandwidth selection
Optimal bandwidth trades off bias (from linearity approximation) and variance (from fewer observations). Calonico, Cattaneo & Titiunik (2014) provide data-driven bandwidth selection with bias-corrected inference.
18.10 Validity Checks
- McCrary density test: test for manipulation of the running variable at \(c\) (no density jump should be present if assignment is as-good-as-random near \(c\))
- Pre-treatment covariate smoothness: check that baseline covariates are smooth through \(c\)
- Placebo cutoffs: test for jumps at non-threshold values
18.11 References
Imbens, G. W. and Lemieux, T. (2008). “Regression Discontinuity Designs: A Guide to Practice.” Journal of Econometrics, 142(2), 615–635.
Calonico, S., Cattaneo, M. D. and Titiunik, R. (2014). “Robust Nonparametric Confidence Intervals for Regression-Discontinuity Designs.” Econometrica, 82(6), 2295–2326.