Chuyển tới nội dung chính

Logit — Hồi quy logistic nhị phân

Logit mô hình hóa xác suất của một biến phụ thuộc nhị phân (Y{0,1}Y \in \{0,1\}) qua hàm liên kết logistic. Đây là mô hình chuẩn khi kết quả là "có/không" (vỡ nợ, tham gia, đậu/rớt…).

Khi nào dùng

Dùng Logit khi YY nhị phân. Hệ số Logit diễn giải qua tỷ số odds eβe^{\beta}; để diễn giải trực tiếp theo xác suất, hãy đọc tác động biên (marginal effects).


Đặc tả mô hình

P(Yi=1Xi)=11+e(β0+β1X1i++βkXki)P(Y_i = 1 \mid X_i) = \frac{1}{1 + e^{-(\beta_0 + \beta_1 X_{1i} + \dots + \beta_k X_{ki})}}

Ước lượng bằng Maximum Likelihood (MLE). Hệ số βj\beta_j: eβje^{\beta_j} là tỷ số odds; tác động biên phụ thuộc giá trị XX.


Diễn giải & chẩn đoán

  • Tỷ số odds eβj>1e^{\beta_j} > 1 ⇒ tăng odds; <1< 1 ⇒ giảm.
  • Tác động biên (trung bình AME hoặc tại trung bình MEM) cho thay đổi xác suất.
  • Đánh giá khớp: Pseudo-R2R^2 (McFadden), độ chính xác phân loại, đường ROC/AUC.
  • Kiểm tra: phân tách hoàn hảo (perfect separation), đa cộng tuyến.

Thực hiện trong EcoLab

  1. Module Mô hình hóa → họ Biến phụ thuộc giới hạnLogit.
  2. Chọn YY nhị phân và các XX.
  3. Chạy, đọc hệ số, tỷ số odds, tác động biên, AUC; xuất mã tái lập.

Ví dụ đầu vào / đầu ra

Đầu vào (minh họa): vo_no (0/1) theo don_bay, roa, quy_mo.

Đầu ra (định dạng, số liệu minh họa — không phải kết quả thực):

BiếnHệ sốOdds ratioAMEp-value
don_bay1.203.320.180.000
roa−2.100.12−0.310.001

Minh họa mã tái lập

* === Hồi quy Logit ===
logit vo_no don_bay roa quy_mo

* Tác động biên trung bình (AME)
margins, dydx(*)

* Bảng phân loại (confusion matrix)
estat classification

* Odds ratio
logit vo_no don_bay roa quy_mo, or

* Đường ROC và AUC
lroc

Hạn chế

  • Hệ số thô không là tác động xác suất — phải dùng marginal effects.
  • Giả định dạng hàm logistic; với probit normal CDF xem Probit.

Video minh họa

Video Tutorial: Hướng dẫn chạy Logit trong EcoLab

Xem thêm