Chuyển tới nội dung chính

Poisson — Hồi quy biến đếm

Hồi quy Poisson mô hình hóa biến đếm (số nguyên không âm: số bằng sáng chế, số lần khám bệnh, số vụ tai nạn…). Mô hình dùng hàm liên kết log đảm bảo kỳ vọng luôn dương.

Khi nào dùng

Dùng Poisson khi YYsố đếm. Giả định cốt lõi: kỳ vọng bằng phương sai (equidispersion). Nếu phương sai lớn hơn kỳ vọng (overdispersion), chuyển sang Negative Binomial.


Đặc tả mô hình

E[YiXi]=exp(β0+β1X1i++βkXki),YiPoisson(μi)E[Y_i \mid X_i] = \exp(\beta_0 + \beta_1 X_{1i} + \dots + \beta_k X_{ki}), \qquad Y_i \sim \text{Poisson}(\mu_i)

Ước lượng bằng MLE. Hệ số diễn giải qua tỷ số tỷ lệ sự kiện eβje^{\beta_j} (incidence rate ratio).


Chẩn đoán

  • Overdispersion: kiểm tra Var(Y)>E[Y]\text{Var}(Y) > E[Y] (vd kiểm định của Cameron-Trivedi). Nếu có ⇒ SE bị đánh giá thấp ⇒ dùng NegBin hoặc Poisson với sai số chuẩn robust/QMLE.
  • Dư thừa số 0 (excess zeros) ⇒ ZIP.

Thực hiện trong EcoLab

  1. Module Mô hình hóa → họ Dữ liệu đếmPoisson.
  2. Chọn YY đếm và các XX; chọn exposure/offset nếu cần (vd theo dân số).
  3. Chạy, đọc IRR, kiểm tra overdispersion; xuất mã tái lập.

Minh họa mã tái lập

* === Hồi quy Poisson ===
poisson patents rd_spend firm_size, vce(robust)

* Incidence Rate Ratios (IRR)
poisson patents rd_spend firm_size, vce(robust) irr

* Kiểm tra overdispersion (so sánh mean vs variance)
estat gof

Hạn chế

  • Giả định equidispersion thường bị vi phạm trong thực tế.
  • Excess zeros làm Poisson khớp kém ⇒ dùng mô hình zero-inflated/hurdle.

Video minh họa

Video Tutorial: Hướng dẫn chạy Poisson Regression trong EcoLab

Xem thêm