Poisson — Hồi quy biến đếm
Hồi quy Poisson mô hình hóa biến đếm (số nguyên không âm: số bằng sáng chế, số lần khám bệnh, số vụ tai nạn…). Mô hình dùng hàm liên kết log đảm bảo kỳ vọng luôn dương.
Khi nào dùng
Dùng Poisson khi là số đếm. Giả định cốt lõi: kỳ vọng bằng phương sai (equidispersion). Nếu phương sai lớn hơn kỳ vọng (overdispersion), chuyển sang Negative Binomial.
Đặc tả mô hình
Ước lượng bằng MLE. Hệ số diễn giải qua tỷ số tỷ lệ sự kiện (incidence rate ratio).
Chẩn đoán
- Overdispersion: kiểm tra (vd kiểm định của Cameron-Trivedi). Nếu có ⇒ SE bị đánh giá thấp ⇒ dùng NegBin hoặc Poisson với sai số chuẩn robust/QMLE.
- Dư thừa số 0 (excess zeros) ⇒ ZIP.
Thực hiện trong EcoLab
- Module Mô hình hóa → họ Dữ liệu đếm → Poisson.
- Chọn đếm và các ; chọn exposure/offset nếu cần (vd theo dân số).
- Chạy, đọc IRR, ki ểm tra overdispersion; xuất mã tái lập.
Minh họa mã tái lập
- Stata
- R
- Python
* === Hồi quy Poisson ===
poisson patents rd_spend firm_size, vce(robust)
* Incidence Rate Ratios (IRR)
poisson patents rd_spend firm_size, vce(robust) irr
* Kiểm tra overdispersion (so sánh mean vs variance)
estat gof
# === Hồi quy Poisson ===
model <- glm(patents ~ rd_spend + firm_size,
family = poisson,
data = df)
summary(model)
# Incidence Rate Ratios (IRR)
exp(coef(model))
exp(confint(model))
# Kiểm tra overdispersion
library(AER)
dispersiontest(model)
# === Hồi quy Poisson ===
import statsmodels.api as sm
import numpy as np
X = sm.add_constant(df[["rd_spend", "firm_size"]])
y = df["patents"]
model = sm.GLM(y, X, family=sm.families.Poisson()).fit()
print(model.summary())
# Incidence Rate Ratios (IRR)
print("\nIRR:")
print(np.exp(model.params))
# Kiểm tra overdispersion: Pearson chi2 / df_resid >> 1 ⇒ overdispersion
print(f"\nOverdispersion ratio: {model.pearson_chi2 / model.df_resid:.2f}")
Hạn chế
- Giả định equidispersion thường bị vi phạm trong thực tế.
- Excess zeros làm Poisson khớp kém ⇒ dùng mô hình zero-inflated/hurdle.
Video minh họa
Video Tutorial: Hướng dẫn chạy Poisson Regression trong EcoLab
Xem thêm
- Negative Binomial · ZIP · ZINB · Danh mục