16 Introducción a la Inferencia Causal

Un desafío central de la economía empírica consiste en distinguir entre correlación y causalidad. Los datos suelen mostrar asociaciones entre variables, pero una interpretación causal exige un diseño empírico cuidadoso y supuestos claramente establecidos.

Los experimentos aleatorizados ofrecen un punto de referencia limpio para la identificación causal.

El problema fundamental de la inferencia causal

Para cada unidad \(i\), definimos los resultados potenciales \((Y_i(1), Y_i(0))\), es decir, el resultado bajo tratamiento y bajo control, respectivamente. El efecto causal para la unidad \(i\) es:

\[ \tau_i = Y_i(1) - Y_i(0) \]

Sin embargo, solo observamos uno de esos dos resultados potenciales. Este es el problema fundamental de la inferencia causal (Holland, 1986). Por ello, la identificación causal requiere supuestos sobre la relación entre la asignación al tratamiento y los resultados potenciales.

Experimentos aleatorizados (RCT)

Cuando el tratamiento \(D_i\) se asigna aleatoriamente, se cumple que \(D_i \perp (Y_i(0),Y_i(1))\), por lo que: \[ E[Y_i(1)] - E[Y_i(0)] = E[Y_i \mid D_i=1] - E[Y_i \mid D_i=0] \]

La diferencia de medias identifica el Efecto Promedio del Tratamiento (ATE). Los experimentos aleatorizados constituyen el punto de referencia ideal para la identificación causal, pero en muchos contextos no son factibles debido a costos, restricciones éticas o problemas de escala.

16.1 Estrategias observacionales

Cuando la aleatorización no está disponible, los economistas recurren a métodos cuasi-experimentales:

Método	Supuesto de identificación
DiD (Diferencias en Diferencias)	Tendencias paralelas en ausencia de tratamiento
RDD (Diseño de Regresión Discontinua)	Continuidad de los resultados potenciales en el umbral
IV (Variables Instrumentales)	Relevancia del instrumento + restricción de exclusión
Matching / Selección sobre observables	Independencia condicional: \(D_i \perp Y_i(0), Y_i(1) \mid X_i\)

16.2 Secciones

Diferencias en Diferencias — modelo \(2\times 2\), efectos fijos de dos vías, event study y DiD con adopción escalonada.
Diseño de Regresión Discontinua — RDD sharp y fuzzy, regresión lineal local y selección de bandwidth.

16.3 Referencias

Angrist, J. D. and Pischke, J.-S. (2009). Mostly Harmless Econometrics. Princeton University Press.

Imbens, G. W. and Rubin, D. B. (2015). Causal Inference for Statistics, Social, and Biomedical Sciences. Cambridge University Press.