Chuyển tới nội dung chính

RDD — Regression Discontinuity Design

RDD (Hồi quy gián đoạn) đánh giá tác động nhân quả khi việc nhận can thiệp được quyết định bởi một ngưỡng (cutoff) của một biến chạy (running variable) — vd điểm thi ≥ ngưỡng thì được học bổng. So sánh đối tượng ngay trên và ngay dưới ngưỡng (gần như ngẫu nhiên) cho ước lượng nhân quả đáng tin tại ngưỡng.

Sharp vs Fuzzy

Sharp RDD: vượt ngưỡng ⇒ chắc chắn nhận can thiệp. Fuzzy RDD: vượt ngưỡng chỉ tăng xác suất nhận ⇒ kết hợp với IV (dùng ngưỡng làm công cụ).


Trực giác

Ước lượng bước nhảy (jump) của E[YX]E[Y \mid X] tại ngưỡng cc; đây là tác động nhân quả cục bộ (LATE) tại ngưỡng.


Thực hiện trong EcoLab

  1. Module Mô hình hóa → họ Suy luận nhân quảRDD.
  2. Khai báo biến chạy, ngưỡng, biến kết quả; chọn sharp/fuzzy, băng thông (bandwidth), bậc đa thức.
  3. Chạy; xem đồ thị RDD + ước lượng tại ngưỡng; kiểm định McCrary (thao túng ngưỡng); xuất mã tái lập.

Minh họa mã tái lập

* === RDD — Regression Discontinuity Design ===
* cần cài: ssc install rdrobust

* Ước lượng RDD với băng thông tối ưu
rdrobust y score, c(50)

* Đồ thị RDD (scatter + đường khớp hai bên ngưỡng)
rdplot y score, c(50)

Hạn chế

  • Chỉ nhận dạng tác động cục bộ tại ngưỡng (LATE), không khái quát toàn mẫu.
  • Nhạy với băng thông và dạng hàm; cần kiểm tra thao túng biến chạy.

Video minh họa

Video Tutorial: Hướng dẫn chạy RDD trong EcoLab

Xem thêm