Chuyển tới nội dung chính

TLS — Bình phương nhỏ nhất toàn phần

TLS (Total Least Squares) — còn gọi là hồi quy trực giao — xử lý trường hợp cả biến độc lập XX lẫn biến phụ thuộc YY đều có sai số đo lường (errors-in-variables). Trong khi OLS chỉ tối thiểu hóa sai số theo phương YY, TLS tối thiểu hóa khoảng cách trực giao từ điểm dữ liệu đến đường hồi quy.

Khi nào dùng

Dùng TLS khi XX không đo lường chính xác (sai số đo). OLS khi đó cho hệ số chệch về 0 (attenuation bias); TLS giảm thiểu vấn đề này.


Trực giác

OLS tối thiểu (YiY^i)2\sum (Y_i - \hat{Y}_i)^2 (theo trục YY); TLS tối thiểu tổng bình phương khoảng cách vuông góc từ điểm (Xi,Yi)(X_i, Y_i) tới đường hồi quy.


Đặc tả mô hình

Với mô hình errors-in-variables: Yi=β0+β1Xi+εiY_i = \beta_0 + \beta_1 X_i^{*} + \varepsilon_i nhưng ta chỉ quan sát Xi=Xi+uiX_i = X_i^{*} + u_i (có nhiễu uiu_i). TLS ước lượng β\beta qua phân rã giá trị suy biến (SVD) của ma trận dữ liệu mở rộng [XY][X \mid Y].


Thực hiện trong EcoLab

  1. Module Mô hình hóa → họ Hồi quy tuyến tính cổ điểnTLS.
  2. Chọn YY và các XX nghi có sai số đo lường.
  3. Chạy và so sánh hệ số với OLS để thấy mức hiệu chỉnh attenuation; xuất mã tái lập.

Minh họa mã tái lập

* === Errors-in-variables regression (Stata) ===
* eivreg: hồi quy sai số đo lường
* r(x1 0.9) nghĩa là reliability ratio của x1 = 0.9
eivreg y x1 x2, r(x1 0.9)

* So sánh với OLS thường
regress y x1 x2

Hạn chế

  • Cần giả định về tỉ lệ phương sai sai số giữa XXYY.
  • Nếu có biến công cụ tốt, IV/2SLS là lựa chọn thay thế phổ biến cho errors-in-variables.

Video minh họa

Video Tutorial: Hướng dẫn chạy TLS trong EcoLab

Xem thêm