Chuyển tới nội dung chính

PSM — Propensity Score Matching

PSM (Propensity Score Matching) đánh giá tác động của can thiệp trên dữ liệu quan sát bằng cách ghép cặp mỗi đối tượng xử lý (treated) với đối tượng đối chứng (control)điểm xu hướng (propensity score) — xác suất tham gia ước lượng từ các biến quan sát — tương tự nhau. Mục tiêu: mô phỏng thí nghiệm ngẫu nhiên, giảm thiên lệch chọn lọc theo biến quan sát được.

Giả định then chốt

PSM dựa trên selection on observables (CIA): mọi yếu tố ảnh hưởng cả việc tham gia lẫn kết quả đều quan sát được. Nếu có biến gây nhiễu không quan sát được, PSM vẫn chệch (khác IV/DiD xử lý được phần nào yếu tố không quan sát).


Quy trình

Điểm xu hướng p(X)=P(treat=1X)p(X) = P(\text{treat}=1 \mid X) ước lượng bằng Logit/Probit.


Thực hiện trong EcoLab

  1. Module Mô hình hóa → họ Suy luận nhân quảPSM.
  2. Khai báo biến xử lý, biến kết quả, biến nền (covariates); chọn thuật toán ghép cặp.
  3. Chạy; kiểm tra balance + common support; đọc ATT; xuất mã tái lập.

Minh họa mã tái lập

* === PSM — Propensity Score Matching ===

* Ghép cặp: nearest neighbor, caliper = 0.05
* cần cài: ssc install psmatch2
psmatch2 treated x1 x2 x3, outcome(y) neighbor(1) caliper(0.05)

* Kiểm tra cân bằng (balance) sau ghép cặp
pstest x1 x2 x3

* ATT nằm trong kết quả psmatch2

Hạn chế

  • Không xử lý nhiễu không quan sát được.
  • Nhạy với lựa chọn thuật toán ghép cặp; cần kiểm tra cân bằng kỹ.

Video minh họa

Video Tutorial: Hướng dẫn chạy PSM trong EcoLab

Xem thêm