Chuyển tới nội dung chính

Pooled OLS — Hồi quy gộp dữ liệu bảng

Pooled OLS gộp toàn bộ quan sát của dữ liệu bảng (N đơn vị × T kỳ) thành một mẫu duy nhất rồi chạy OLS như dữ liệu chéo, bỏ qua cấu trúc bảng. Đây là mô hình cơ sở (baseline) để so sánh với FE/RE.

Giả định mạnh

Pooled OLS giả định không có hiệu ứng cá thể (αi\alpha_i giống nhau mọi đơn vị). Nếu tồn tại đặc điểm riêng không quan sát được tương quan với XX, Pooled OLS chệch ⇒ dùng FE. Sai số trong cùng đơn vị thường tương quan ⇒ cần sai số chuẩn cụm (clustered).


Đặc tả mô hình

Yit=β0+Xitβ+εitY_{it} = \beta_0 + X_{it}\beta + \varepsilon_{it}

Giống OLS nhưng dùng toàn bộ N×TN \times T quan sát. Nên dùng clustered SE theo đơn vị.


Thực hiện trong EcoLab

  1. Module Mô hình hóa → họ Dữ liệu bảng tuyến tínhPooled OLS.
  2. Khai báo entity/time, YY, XX; chọn clustered SE.
  3. Chạy; so sánh với FE/RE qua kiểm định; xuất mã tái lập.

Minh họa mã tái lập

* === Pooled OLS với sai số chuẩn cụm ===
* Sai số chuẩn cụm theo đơn vị (entity)
reg y x1 x2, vce(cluster id)

Video minh họa

Video Tutorial: Hướng dẫn chạy Pooled OLS trong EcoLab

Xem thêm