16 Introducción a la Inferencia Causal
Un desafío central de la economía empírica consiste en distinguir entre correlación y causalidad. Los datos suelen mostrar asociaciones entre variables, pero una interpretación causal exige un diseño empírico cuidadoso y supuestos claramente establecidos.

El problema fundamental de la inferencia causal
Para cada unidad \(i\), definimos los resultados potenciales \((Y_i(1), Y_i(0))\), es decir, el resultado bajo tratamiento y bajo control, respectivamente. El efecto causal para la unidad \(i\) es:
\[ \tau_i = Y_i(1) - Y_i(0) \]
Sin embargo, solo observamos uno de esos dos resultados potenciales. Este es el problema fundamental de la inferencia causal (Holland, 1986). Por ello, la identificación causal requiere supuestos sobre la relación entre la asignación al tratamiento y los resultados potenciales.
Experimentos aleatorizados (RCT)
Cuando el tratamiento \(D_i\) se asigna aleatoriamente, se cumple que \(D_i \perp (Y_i(0),Y_i(1))\), por lo que: \[ E[Y_i(1)] - E[Y_i(0)] = E[Y_i \mid D_i=1] - E[Y_i \mid D_i=0] \]
La diferencia de medias identifica el Efecto Promedio del Tratamiento (ATE). Los experimentos aleatorizados constituyen el punto de referencia ideal para la identificación causal, pero en muchos contextos no son factibles debido a costos, restricciones éticas o problemas de escala.
16.1 Estrategias observacionales
Cuando la aleatorización no está disponible, los economistas recurren a métodos cuasi-experimentales:
| Método | Supuesto de identificación |
|---|---|
| DiD (Diferencias en Diferencias) | Tendencias paralelas en ausencia de tratamiento |
| RDD (Diseño de Regresión Discontinua) | Continuidad de los resultados potenciales en el umbral |
| IV (Variables Instrumentales) | Relevancia del instrumento + restricción de exclusión |
| Matching / Selección sobre observables | Independencia condicional: \(D_i \perp Y_i(0), Y_i(1) \mid X_i\) |
16.2 Secciones
- Diferencias en Diferencias — modelo \(2\times 2\), efectos fijos de dos vías, event study y DiD con adopción escalonada.
- Diseño de Regresión Discontinua — RDD sharp y fuzzy, regresión lineal local y selección de bandwidth.
16.3 Referencias
Angrist, J. D. and Pischke, J.-S. (2009). Mostly Harmless Econometrics. Princeton University Press.
Imbens, G. W. and Rubin, D. B. (2015). Causal Inference for Statistics, Social, and Biomedical Sciences. Cambridge University Press.