Chuyển tới nội dung chính

Ridge — Hồi quy chính quy hóa L2

Ridge thêm một lượng phạt L2 vào hàm mục tiêu OLS để co (shrink) các hệ số về gần 0, giúp ổn định ước lượng khi có đa cộng tuyến hoặc nhiều biến giải thích (p lớn). Ridge không đưa hệ số về đúng 0 (không chọn biến) nhưng giảm phương sai ước lượng đáng kể.

Khi nào dùng

Dùng Ridge khi các biến giải thích tương quan cao (đa cộng tuyến) khiến OLS bất ổn (hệ số phình to, đổi dấu). Nếu cần chọn biến, dùng Lasso.


Đặc tả mô hình

Ridge tối thiểu hóa tổng bình phương phần dư cộng phạt L2:

minβ  i=1n(YiXiβ)2+λj=1pβj2\min_{\beta} \; \sum_{i=1}^{n} (Y_i - X_i \beta)^2 + \lambda \sum_{j=1}^{p} \beta_j^2

λ0\lambda \ge 0tham số điều chuẩn (regularization): λ=0\lambda = 0 ⇒ OLS; λ\lambda càng lớn ⇒ co càng mạnh.


Chọn lambda & lưu ý

  • Chọn λ\lambda bằng cross-validation (CV).
  • Chuẩn hóa (standardize) biến trước khi chạy vì phạt nhạy với thang đo.
  • Ridge giảm phương sai nhưng tăng độ chệch (bias-variance tradeoff).

Thực hiện trong EcoLab

  1. Module Mô hình hóa → họ Hồi quy chính quy hóaRidge.
  2. Chọn YY, các XX; bật chuẩn hóa; chọn λ\lambda (hoặc CV tự động).
  3. Chạy và đọc hệ số đã co, đường co theo λ\lambda; xuất mã tái lập.

Minh họa mã tái lập

* === Ridge Regression (Stata) ===
* Stata không có lệnh ridge tích hợp chính thức.
* Dùng gói ridgereg (cài: ssc install ridgereg) hoặc tính thủ công:

* Cách 1: Dùng gói ridgereg
* ridgereg y x1-x20, lambda(10)

* Cách 2: Post-estimation thủ công
* Chuẩn hóa biến trước, ước lượng OLS sau khi thêm phạt L2
regress y x1-x20
estat ic

Hạn chế

  • Không chọn biến (mọi hệ số khác 0).
  • Diễn giải hệ số khó hơn OLS do đã bị co; thường dùng cho dự báo hơn là suy diễn nhân quả.

Video minh họa

Video Tutorial: Hướng dẫn chạy Ridge trong EcoLab

Xem thêm