Ý NGHĨA CỦA GIÁ TRỊ R BÌNH PHƯƠNG HIỆU CHỈNH TRONG HỒI QUY, R SQUARE LÀ GÌ

Chào các bạn, hôm nay nhóm Thạc Sĩ QTKD ĐH Bách Khoa HCM giới thiệu đến các bạn chi tiết nội dung ý nghĩa của hai giá trị khá quan trọng khi chạy mô hình hồi quy tuyến tính đa biến, đó là hệ số R bình phương (R Square) và R bình phương hiệu chỉnh( còn gọi là R bình phương điều chỉnh, hay Adjusted R Square). Hai giá trị này dùng đo sự phù hợp của mô hình hồi quy, còn gọi là hệ số xác định ( coefficient of detemination). Hệ số R bình phương từ đây sẽ được gọi tắt là R2 nhé.

Bạn đang xem: Ý nghĩa của giá trị r bình phương hiệu chỉnh trong hồi quy

Công thức tính hệ số R bình phương.

Công thức tính hệ số R bình phương xuất phát từ ý tưởng: toàn bộ sự biến thiên của biến phụ thuộc được chia làm hai phần: phần biến thiên do hồi quy và phần biến thiên không do hồi quy( còn gọi là phần dư).

Regression Sum of Squares(RSS): tổng các độ lệch bình phương giải thích từ hồi quy

Residual Sum of Squares(ESS): tổng các độ lệch bình phương phần dư

Total Sum of Squares(TSS): tổng các độ lệch bình phương toàn bộ

Giá trị R bình phương dao động từ 0 đến 1. R bình phương càng gần 1 thì mô hình đã xây dựng càng phù hợp với bộ dữ liệu dùng chạy hồi quy. R bình phương càng gần 0 thì mô hình đã xây dựng càng kém phù hợp với bộ dữ liệu dùng chạy hồi quy. Trường hợp đặt biệt, phương trình hồi quy đơn biến ( chỉ có 1 biến độc lập) thì R2 chính là bình phương của hệ số tương quan r giữa hai biến đó.

Ý nghĩa R bình phương

Ý nghĩa cụ thể:giả sử R bình phương là 0.60, thì mô hình hồi quy tuyến tính này phù hợp với tập dữ liệu ở mức 60%. Nói cách khác, 60% biến thiên của biến phụ thuộc được giải thích bởi các biến độc lập.( còn 40% còn lại ở đâu, dĩ nhiên là do sai số đo lường, do cách thu thập dữ liệu, do có thể có biến độc lập khác giải thích cho biến phụ thuộc mà chưa được được vào mô hình nghiên cứu…vv). Thông thường, ngưỡng của R2 phải trên 50%, vì như thế mô hình mới phù hợp. Tuy nhiên tùy vào dạng nghiên cứu, như các mô hình về tài chính, không phải tất cả các hệ số R2 đều bắc buộc phải thỏa mãn lớn hơn 50%.( do rất khó dể dự đoán giá vàng, giá cổ phiếu mà chỉ đơn thuần dựa vào các biến độc lập ví dụ GDP, ROA,ROE….)

Hạn chế của hệ số R bình phương

Càng đưa thêm nhiều biến vào mô hình, mặc dù chưa xác định biến đưa vào có ý nghĩa hay không thì giá trị R2 sẽ tăng. Lý do là khi càng đưa thêm biến giải thích vào mô hình thì sẽ càng khiến phần dư giảm xuống (vì bản chất những gì không giải thích được đều nằm ở phần dư), do vậy tăng thêm biến sẽ khiến tổng bình phương phần dư(Residual Sum of Squares) giảm, trong khi Total Sum of Squares không đổi, dẫn tới R2 luôn luôn tăng.Giá trị R2 tăng khả năng giải thích của mô hình, nhưng bản chất thì lại không làm rõ được tầm quan trọng của biến đưa vào, do đó nếu dựa vào giá trị R2 để đánh giá tính hiệu quả của mô hình sẽ dẫn đến tình huống không chính xác vì sẽ đưa quá nhiều biến không cần thiết, làm phức tạp mô hình.

Để ngăn chặn tình trạng như đã nêu trên, một phép đo khác về mức độ thích hợp được sử dụng thường xuyên hơn. Phép đo này gọi là R2 hiệu chỉnh hoặc R2 hiệu chỉnh theo bậc tự do.

Xem thêm: "mah boo" có nghĩa là gì? hĩa chính xác của từ boo là gì? mah boo có nghĩa là gì

Hệ số R bình phương hiệu chỉnh

Công thức tính hệ số R bình phương hiệu chỉnh

*

Trong đó:

n= số lượng mẫu quan sát.

k= số tham số của mô hình, bằng số lượng biến độc lập cộng 1

R2: hệ số R bình phương

Việc thêm vào một biến dẫn đến tăng R2 nhưng cũng làm giảm đi một bậc tự do, bởi vì chúng ta đang ước lượng thêm một tham số nữa. R2 hiệu chỉnh là một phép đo độ thích hợp tốt hơn bởi vì nó cho phép đánh đổi giữa việc tăng R2 và giảm bậc tự do. Cũng cần lưu ý là vì (n-1)/(n – k) không bao giờ nhỏ hơn 1 nên R2 hiệu chỉnh sẽ không bao giờ lớn hơn R2 . Tuy nhiên, mặc dù R2 không thể âm, R2 hiệu chỉnh có thể nhỏ hơn không. Ví dụ, khi n = 26, k = 6, và R2 = 0,1, chúng ta có R2 hiệu chỉnh = 0,125 .

Ví dụ tính R2 và R2 hiệu chỉnh bằng tay theo công thức dựa trên kết quả phân tích hồi quy đa biến

Sau khi thực hiện phân tích hồi quy đa biến, sẽ ra được bảng kết quả sau:

*

Trong bảng Model Summary đã có sẵn R2 và R2 hiệu chỉnh. Tuy nhiên ta sẽ thực hiện tính toán giá trị này dựa vào bảng ANOVA bên dưới để hiểu rõ vấn đề.

Nhắc lại công thức tính R bình phương:

Trong bài này:

ESS=Residual Sum of Squares= 30.036

TSS=Total Sum of Squares = 86.721

do đó: R2=1-(ESS/TSS) =1-(30.036/86.721)= 0.654

Như vậy ta đã tính được bằng công thức giá trị R square=0.654. Bây giờ ta tính tiếp giá trị adjusted R square nhé

R2_hiệuchỉnh=1-(n-1)*(1-R2)/(n-k)

n= số lượng mẫu quan sát=160

k= số tham số của mô hình, bằng số lượng biến độc lập cộng 1= 6+1=7

vậy R2_hiệuchỉnh=1-(n-1)*(1-R2)/(n-k)=1-(160-1)*(1-0.654)/(160-7)= 0.640

Như vậy R_bìnhphương_hiệuchỉnh=0.640 bé hơn R_bìnhphương=0.654

R square là một thuật ngữ không còn xa lạ. Tuy nhiên, nhiều người lại chưa thực sự hiểu về thuật ngữ này. Vậy r square là gì và nó có ý nghĩa thế nào trong kinh tế lượng? Tất cả những thắc mắc đó sẽ được giải đáp dưới đây. Hãy cùng tekkenbasara.mobi tìm hiểu nhé!


R square là gì? Ý nghĩa của r square

Khái niệm r square

R square hay còn được biết tới với cách viết r squared và r bình phương. Vậy r square là gì? Hay nói cách khác, r bình phương là gì? Đây là một thước đo được sử dụng trong thống kê và nó cho chúng ta biết mức độ phù hợp của mô hình nghiên cứu với ý nghĩa là các nhân tố (hay còn gọi là các biến). Đồng thời, hệ số này giải thích nhân tố phụ thuộc đó đạt bao nhiêu phần trăm trong quá trình nghiên cứu.

Ý nghĩa của r square

R square hay r bình phương được sử dụng nhiều trong kinh tế lượng. Vậy ý nghĩa của r bình phương trong kinh tế lượng là gì? R bình phương được sử dụng trong thống kê và được thực hiện bởi phương pháp gọi là hồi quy tuyến tính.

R bình phương cho biết mô hình đó hợp với dữ liệu ở mức bao nhiêu %.

Ví dụ: r bình phương = 0,65. Vậy mô hình hồi quy tuyến tính đang được thống kê sẽ phù hợp với dữ liệu (hoặc biến) ở mức 65%.


R bình phương cũng cho biết độ phù hợp của mô hình, người ta nghiên cứu được rằng, với r bình phương > 50% thì một mô hình được đánh giá là phù hợp.

Tất nhiên, không phải tất cả các mô hình đều phải có r bình phương > 50%, ta có thể loại trừ một số mô hình có sự biến động lớn như giá vàng hay giá cổ phiếu…

Đặc biệt, giá trị r2 càng cao thì mối quan hệ giữa nhân tố độc lập (biến độc lập) và nhân tố phụ thuộc càng chặt chẽ. Vì thế mà r bình phương còn được biết tới với cái tên hệ số tương quan r bình phương.

Qua đó có thể thấy ý nghĩa hệ số xác định r2  là vô cùng quan trọng trong thống kê và nghiên cứu, đặc biệt là trong phương pháp hồi quy tuyến tính.

*

Công thức tính r square

Sau khi đã biết r square là gì và nó có ý nghĩa như thế nào, chúng ta cùng tìm hiểu đến công thức tính hệ số này.

Hiện nay, công thức tính hệ số tương quan r2 đang được sử dụng như sau:

\(R^{2} = 1 – \frac{ESS}{TSS}\)

Trong đó:

ESS là viết tắt của Residual Sum of Squares, tức là tổng các độ lệch bình phương của phần dư.TSS là viết tắt của Total Sum of Squares, tức là tổng độ lệch bình phương của toàn bộ các nhân tố nghiên cứu.

Từ công thức này, có thể thấy R sẽ trong khoảng từ 0 đến 1. Trong khi tính ESS ta cũng cần lưu ý multiple r. Vậy multiple r là gì? Multiple r là viết tắt của multiple regression. Đây là hệ số tương quan hồi quy nhiều lần gắn liền mật thiết với r square.


Chỉ số này cho phép bạn kiểm tra xem việc đưa thêm một biến vào mô hình có còn được hay không; đồng thời nó còn có khả năng loại trừ ảnh hưởng của một số biến. Khi chạy SPSS – một phần mềm thống kê phổ biến hiện nay, bạn cần hết sức lưu ý chỉ số này.


Hệ số r bình phương hiệu chỉnh

Bên cạnh r bình phương, r bình phương hiệu chỉnh cũng là một khái niệm không thể bỏ qua. Đây là một hệ số được sử dụng để hạn chế những nhược điểm của r bình phương.

Công thức tính r bình phương hiệu chỉnh

\(R_{hc}^{2} = 1 – \frac{ESS/(n-k)}{TSS/(n-1)}\)

Sau khi biến đổi ta được: \(R_{hc}^{2} = 1 – \frac{n-1}{n-k}(1-R^{2})\)

Trong đó:

n là số lượng mẫu quan sát. k tham số của mô hình (bằng lượng biến độc lập cộng thêm 1)

Ý nghĩa của r2 hiệu chỉnh

Hạn chế nổi bật nhất của r square là việc giảm tính chính xác của mô hình khi ta thêm một tham số trong quá trình tính toán. Vì vậy, r bình phương hiệu chỉnh được nghiên cứu giúp khắc phục nhược điểm của r bình phương thông thường. Hệ số này cho phép ta đo độ thích hợp khi ta thêm một tham số nữa. Qua đó giúp giảm sự phức tạp của mô hình.

Vậy r square là gì? Công thức tính r square thế nào và ý nghĩa của nó ra sao? Chắc hẳn bạn đã có câu trả lời cho riêng mình thông qua bài viết r square là gì. Đây là một hệ số quan trọng trong tính toán và thống kê, vì thế việc hiểu rõ nó sẽ giúp quá trình thống kê của bạn đơn giản hơn rất nhiều.

Leave a Reply

Your email address will not be published. Required fields are marked *

CÙNG CHUYÊN MỤC MỚI

x

Welcome Back!

Login to your account below

Retrieve your password

Please enter your username or email address to reset your password.