Phát hiện và khắc phục hiện tượng đa cộng tuyến

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (360.68 KB, 28 trang )

MỤC LỤC
Lời mở đầu
Phần I: Lý thuyết
1. Các khái niệm chung về đa cộng tuyến
1.1 Khái niệm về đa cộng tuyến
1.2 Ước lượng trong trường hợp đa cộng tuyến hoàn hảo
1.3 Ước lượng trong trường hợp đa cộng tuyến không hoàn hảo
2. Nguyên nhân và hậu quả của đa cộng tuyến
2.1. Nguyên nhân của đa cộng tuyến
2.2. Hậu quả của đa cộng tuyến
3. Phát hiện sự tồn tại của đa cộng tuyến và biện pháp khắc phục
3.1. Phát hiện sự tồn tại của đa cộng tuyến
3.1.1 R2 cao, t thấp
3.1.2 Hệ số tương quan cặp giữa các biến giải thích cao
3.1.3 Xem xét tương quan riêng
3.1.4 Hồi quy phụ
3.1.5 Nhân tử phóng đại phương sai (VIF)
3.1.6 Độ đo Theils
3.2 Biện pháp khắc phục
3.2.1 Sử dụng thông tin tiên nghiệm
3.2.2 Loại bỏ biến
3.2.3 Thu thập thêm số liệu hoặc lấy mẫu mới
3.2.4 Dùng sai phân cấp một
3.2.5 Giảm tương quan trong hồi quy đa thức
3.2.6 Một số biện pháp khác
Phần II: Bài tập vận dụng
1. Lập mô hình hồi quy
2. Phát hiện sự tồn tại của đa cộng tuyến
3. Biện pháp khắc phục

Phần III. Thảo luận
5.3. Khắc phục hiện tượng phương sai sai số thay đổi
6.3 Khắc phục hiện tượng tự tương quan
7.3 Khắc phục hiện tượng đa cộng tuyến

LỜI MỞ ĐẦU
Trong mô hình phân tích hồi quy bội, chúng ta giả thiết giữa các biến giải thích của mô hình độc lập tuyến tính
với nhau, tức là các hệ số hồi quy đối với một biến cụ thể là số đo tác động riêng phần của biến tương ứng khi
tất cả các biến trong mô hình được giữ cố định. Tuy nhiên nếu giả thiết trên bị vi phạm tức là xảy ra hiện tượng
đa cộng tuyến, khi nó xảy ra sẽ xuất hiện hậu quả như thế nào và làm thế nào để khắc phục nó. Sau đây chúng ta
cùng đi thảo luận đề tài “ Phát hiện và khắc phục hiện tượng đa cộng tuyến”
Trong quá trình tìm hiểu không tránh khỏi sai sót, nhóm 11 rất mong nhận được sự góp ý và nhận xét của thầy
và các bạn để bài thảo luận có thể hoàn thành một cách tốt nhất.

PHẦN I: LÝ THUYẾT
1. Các khái niệm về đa cộng tuyến và ước lượng trong trường hợp đa cộng tuyến hoàn hảo
1.1 Các khái niệm chung về đa cộng tuyến
Tư tưởng đa cộng tuyến thấm sâu vào mọi khía cạnh của hồi quy bội. Lý do làm cho “ đa cộng tuyến” có ảnh
hưởng lớn như vậy là vì khi nghiên cứu mối quan hệ giữa biến Y và các biến giải thích X i, ta gặp quan hệ nào
đó giữa các biến Xi với nhau.
Trường hợp lý tưởng là các biến X i trong môi trường hồi quy bội không có tương quan với nhau; mỗi một
biến Xi chứa một thong tin riêng về Y, thong tin không chứa trong bất kỳ biến X i khác. Trong thực hành, khi
điều này xảy ra ta không gặp hiện tượng đa cộng tuyến.
Ở trường hợp ngược lại, chúng ta gặp đa cộng tuyến hoàn hảo. Giả sử ta phải ước lượng hàm hồi quy Y gồm k
biến giải thích X1, X2, X3, …, Xk.
Yi = β1X1i + β2X2i + … + βkXki + Ui
Đa cộng tuyến hoàn hảo xảy ra khi một biến giải thích dược biểu diễn dưới đạng tổ hợp tuyến tính của các
biến giải thích còn lại đối với mọi điểm của tập số liệu. Hoặc có thể phát biểu: Đa cộng tuyến hoàn hảo giữa các
biến giải thích Xi, X2, X3, …, Xk xảy ra nếu điều kiện sau được thỏa mãn:

λ1X1 + λ2X2 + … + λkXk = 0
trong đó: λ1, λ2, …, λk là các hằng số không đồng thời bằng không.
Thuật ngữ đa công tuyến lần đầu tiên được Ragnar Frisch sử dụng vào năm 1934 với nội dung trên. Tuy nhiên
ngày nay, thuật ngữ này được sử dụng theo nghĩa rộng hơn. Nó bao gồm cả đa cộng tuyến hoàn hảo và trường
hợp trong đó các biến giải thích có tương quan theo nghĩa sau:
λ1X1i + λ2X2i + … + λkXki + Vi = 0
trong đó: Vi là sai số ngẫu nhiên.
1.2 Ước lượng trong trường hợp đa cộng tuyến hoàn hảo
Khi có đa cộng tuyến hoàn hảo thì các hệ số hồi qui không xác định còn các sai số hồi qui là không xác định
còn các sai số tiêu chuẩn là vô hạn.
Xét mô hình hồi qui 3 biến :
(a)

Ta thu được các ước lượng

(b)

(c)
Giả sử : trong đó là hằng số khác không , thay đổi điều kiện này vào (b)
Ta được

(d)

Là biểu thức không xác định . tương tự ta có thể chỉ ra không xác định .
Như vậy trong trường hợp đa cộng tuyến hoàn hảo , chúng ta không thể nhận được lời giải duy nhất cho các hệ
số hồi qui riêng, nhưng trong khi đó ta lại có thể nhận được lời giải duy nhất cho tổ hợp tuyến tính của các hệ số
này. Trong đa cộng tuyến hoàn hảo thì phương sai và các sai số tiêu chuẩn của các ước lượng và là vô hạn .
1.3 Ước lượng trong trường hợp đa cộng tuyến không hoàn hảo
Đa cộng tuyến hoàn hảo chỉ là trường hợp đặc biệt hiếm xảy ra. Trong các số liệu liên quan đến chuỗi thời gian,

thường xảy ra đa cộng tuyến không hoàn hảo. Xét mô hình:

Bây giờ chúng ta giả thiết giữa X2 và X3 có cộng tuyến không hoàn hảo theo nghĩa:

Trong đó λ ≠ 0, là nhiễu ngẫu nhiên sao cho = 0.
Trong trường hợp nay theo phương pháp bình phương nhỏ nhất ta dễ dàng thu được các ước lượng và .
Chẳng hạn:

Trong trường hợp này không có lý do gì để nói là không ước lượng được.
2. Nguyên nhân và hậu quả của đa cộng tuyến
2.1 Nguyên nhân của đa cộng tuyến
Do phương pháp thu thập dữ liệu: các giái trị của các biến độc lập phụ thuộc lẫn nhau trong mẫu nhưng
không phụ thuộc lẫn nhau trong tổng thể.

•

Các dạng mô hình dễ xảy ra đa cộng tuyến:
Hồi quy dạng các biến độc lập được bình phương sẽ xảy ra đa cộng tuyến, đặc biệt khi phạm vi giá trị

•

ban đầu của biến đọc lập là nhỏ.
Các biến độc lập vĩ mô được quan sát theo chuỗi thời gian.
2.2 Hậu quả của đa cộng tuyến

Ta xét trường hợp mô hình có hiện tượng đa cộng tuyến không hoàn hảo, tức là biến độc lập Xi có thể xấp xỉ
tuyến tính theo các biến X2, X3,…,Xk. Có một số trường hợp xảy ra như sau:
2.2.1 Phương sai và hiệp phương sai của các ước lượng bình quân bé nhất lớn
Trong chương mô hình hồi quy bội ta đã có biểu thức:

Và:
Trong đó là hệ số tương quan giữa X2, X3
Từ và ta thấy rằng khi tăng dần đến 1 (nghĩa là cộng tuyến tăng) thỳ phương sai của 2 ước lượng này tăng
dần đến vô hạn. (1.4) chỉ ra rằng khi tăng dần đến 1 thì cov tăng về giá trị tuyệt đối.
2.2.2 Khoảng tin cậy rộng hơn
Giả sử khi thực hành ta có khoảng tin cậy 95% cho và khi đã biết là:
và
Trong đó:

Cho nên ta có thể viết lại các khoảng tin cậy 95% cho là:

Và cho

(1.5) và (1.6) chứng tỏ càng gần tới 1 thì khoảng tin cậy cho các tham số càng rộng.
Do đó trong trường hợp có đa cộng tuyến gần hoàn hảo thì số liệu của mẫu có thể thích hợp với tập các giả thiết
khác nhau. Vì thế xác suất chấp nhận giả thiết sai tăng lên (tức là tăng sai lầm loại II).
2.2.3 Tỷ số t mất ý nghĩa
Như đã biết khi kiểm định giả thiết H0 : β2 =0 chúng ta đã sử dụng tỷ số và đem so sánh giá trị t đã được
ước lượng với giá trị giới hạn t. Trong khi có đa cộng tuyến gần hoàn hảo thì sai số tiêu chuẩn ước lượng được
sẽ rất cao vì vậy làm cho chỉ số t nhỏ đi. Kết quả là sẽ làm tang khả năng chấp nhận H0.
2.2.4 R2 cao nhưng tỉ số ít ý nghĩa
Để giải thích điều này . Ta hãy xét mô hình hồi quy k biến sau:
Y 1 = + + + … + + Ui
Trong trường hợp có đa cộng tuyến gần hoàn hảo, như đã chỉ ra ở trên , ta có thể tìm được một hoặc một số hệ
số góc riêng là không có ý nghĩa thống kê trên cơ sở kiểm định t nhưng khi đó R2 lại có thể rất cao, nên bằng
kiểm định F chúng ta có thể bác bỏ giả thiết H0:==…==0. Mâu thuẫn này cũng là tín hiệu của đa cộng tuyến.
2.2.5 Các ước lượng bình phương bé nhất và các sai số tiêu chuẩn của chúng trở nên rất nhạy đối với
những thay đổi nhỏ trong số liệu.

2.2.6 Dấu của các ước lượng của các hệ số hồi quy có thể sai
Khi có đa cộng tuyến gần hoàn hảo thì có thể thu được các ước lượng của các hệ số hồi quy trái với điều
chúng ta mong đợi. Chẳng hạn lý thuyết kinh tế cho rằng đối với hàng hóa thông thường thu nhập tăng thì cầu
hàng hóa tang, nghĩa là khi hồi quy thu nhập là một là một trong các biến giải thích, biến phụ thuộc là lượng cầu
hàng hóa, nếu xảy ra hiện tượng đa cộng tuyến gần hoàn hảo thì ước lượn hệ số của biến thu nhập có thể mang
dấu âm – mâu thuẫn với điều ta mong đợi.
2.2.7 Thêm vào hay bớt đi các biến cộng tuyến với các biến khác,mô hình sẽ thay đổi về độ lớn trong
các ước lượng hoặc dấu của chúng

3. Phát hiện sự tồn tại của đa cộng tuyến và biện pháp khắc phục
3.1 Phát hiện sự tồn tại của đa cộng tuyến
3.1.1 R2 cao, t thấp
Trong trường hợp R2 cao (thường R2> 0,8) mà tỉ số t thấp thì đó chính là dấu hiệu của hiện tượng đa cộng tuyến.
3.1.2 Hệ số tương quan cặp giữa các biến giải thích cao.
Nếu hệ số tương quan cặp giữa các biến giải thích cao (vượt 0,8) thì có khả năng có tồn tại đa cộng tuyến. Tuy
nhiên tiêu chuẩn này thường không chính xác. Có những trường hợp tương quan cặp không cao nhưng vẫn có
đa cộng tuy ến. Thí dụ, ta có 3 biến giải thích X1, X2, X3 như sau:

X1 = (1,1,1,1,1, 0,0,0,0,0, 0,0,0,0,0, 0,0,0,0,0)
X2= (0,0,0,0,0, 1,1,1,1,1, 0,0,0,0,0, 0,0,0,0,0)
X3 = (1,1,1,1,1, 1,1,1,1,1, 0,0,0,0,0, 0,0,0,0,0)
Rõ ràng X3 = X2 + X1 nghĩa là ta có đa cộng tuyến hoàn hảo, tuy nhiên tương quan cặp là: r 12 = -1/3 ; r13 = r23
=0,59
Như vậy đa cộng tuyến xảy ra mà không có sự bảo trước cuả tương quan cặp những dẫu sao nó cũng cung cấp
cho ta những kiểm tra tiên nghiệm có ích.
3.1.3 Xem xét tương quan riêng .
Vì vấn đề được đề cập đến dựa vào tương quan bậc không. Farrar và Glauber đã đề nghị sử dụng hệ số tương
quan riêng. Trong hồi quy của Y đối với các biến X 4, X2 , X3. Nếu ta nhận thấy răng r21,234 cao trong khi đó r212,34;
r213,24; r214,23 tương đối thấp thì điều đó có thể gợi ý rằng các biến X 2, X3 và X4 có tương quan cao và ít nhất một

trong các biến này là thừa.
Dù tương quan riêng rất có ích nhưng nó cũng không đảm bảo rằng sẽ cung cấp cho ta hướng dẫn chính xác
trong việc phát hiện ra hiện tượng đa cộng tuyến.
3.1.4 Hồi quy phụ.
Một cách có thể tin cậy được để đánh giá mức độ của đa cộng tuyến là hồi quy phụ. Hồi quy phụ là hồi quy
mỗi một biến giải thích Xi theo các biến giải thích còn lại. R2 được tính từ hồi quy này ta ký hiện R2i
Mối liên hệ giữa Fi và R2i

Fi tuân theo phân phối F với k – 2 và n-k +1 bậc tự do. Trong đó n là cỡ mẫu , k là biến số giải thích kể cả hệ số
chặn trong mô hình. R2i là hệ số xác định trong hồi quy của biến X i theo các biến khác. Nếu Fi tính được vượt
điểm tới hạn Fi(k-2,n-k+1) ở mức ý nghĩa đã cho thì có nghĩa là X i có liên hệ tuyến tính với các biến X khác.
Nếu Fi có ý nghĩa về mặt thống kê chúng ta vẫn phải quyến định liệu biến X i nào sẽ bị lo ại khỏi mô hình. Một
trở ngại của kỹ thuật hồi quy phụ là gánh nặng tính toán. Nhưng ngày nay nhiều chương trình máy tính đã có
thể đảm đương được công việc tính toán này.
3.1.5 Nhân tử phóng đại phương sai (VIF)
Một thước đo khác của hiện tượng đa cộng tuyến là nhân tử phóng đại phương sai gắn với biến X i, ký hiệu là
VIF(Xi).
VIF(Xi) được thiết lập trên cơ sở của hệ số xác định R 2i trong hồi quy của biến X i với các biến khác nhau như
sau:
VIF(Xi) = 1/(1- R2i)
Nhìn vào công thức (5.15) có thể giải thích VIF(Xi) bằng tỷ số chung của phương sai thực của β trong hồi quy
gốc của Y đối với các biến X và phương sai của ước lượng β trong hồi quy mà ở đó X i trực giao với các biến
khác. Ta coi tình huống lý tưởng là tình huống mà trong đó các biến độc lập không tương quan với nhau, và
VIF so sánh tình huông thực và tình huống lý tưởng. Sự so sánh này không có ích nhiều và nó không cung cấp
cho ta biết phải làm gì với tình huống đó. Nó chỉ cho biết rằng các tình huống là không lý tưởng.
3.1.6 Độ đo Theil
Khía cạnh chủ yếu của VIF chỉ xem xét đến tương quan qua lại giữa các biến giải thích. Một độ đo mà xem xét
tương quan của biến giải thích với biến được giải thích là độ đo Theil. Độ đo Theil được định nghĩa như sau:
Trong đó R2 là hệ số xác định bội trong hồi quy của Y đối với các biến X2 , X3… Xk trong mô hình hồi quy:

Yi = β1 + β2X2i + β3 X3i+ ……. + βk Xki+ Ui
R2-i là hệ số xác định bội trong mô hình hồi quy của biến Y đối với các biên X2 , X3, … ,Xi-1, Xi+1, … ,Xk
Đại lượng R2 – R2-i được gọi là “đóng góp tăng thêm vào” vào hệ số xác định bội. Nếu X 2 , X3… Xk không
tương quan với nhau thì m = 0 vì những đóng góp tăng thêm đó cộng lại bằng R 2. Trong các trường hợp khác m
có thể nhận giá trị âm hoặc dương lớn.
Để thấy được độ đo này có ý nghĩa, chúng ta xét trường hợp mô hình có 2 biến giải thích X 2 và X3. Theo ký
hiệu đã sử dụng ở chương trước ta có:
m = R2- ( R2- r212) – (R2– r213)
Tỷ số t liên hệ với tương quan riêng r212,3, r213,2
Trong phần hồi quy bội ta đã biết:
R2 = r212 + (1- r212) r213,2
R2 = r213 + (1- r213) r212,3
Thay 2 công thức này vào biểu thức xác định m ta được:
m = R2- (r212 + (1- r212) r213,2 – r212) - ( r213 + (1- r213) r212,3- r213 ) = R2- ((1- r212) r213,2 + (1- r213) r212,3)

(5.17)

Đặt 1- r212 = w2; 1- r213 = w3 và gọi là các trọng số. Công th ức (5.17) được viết lại dưới dạng m = R 2- (w2 r213,2 +
w3 r212,3)

Như vây độ đo Theil bằng hiệu giữa hệ số xác định bội và tổng có trọng số của các hệ số tương quan riêng.
3.2 Biện pháp khắc phục
3.2.1 Dùng thông tin tiên nghiệm
Một trong các cách tiếp cận để giải quyết vấn đề đa cộng tuyến là phải tận dụng thông tin tiên nghiệm hoặc
thông tin từ nguồn khác để ước lượng các hệ số riêng.
Mô hình sản xuất Cobb-Douglas

Có thể xảy ra đa cộng tuyến do K và L cùng tăng theo quy mô sản xuất. Nếu biết hiệu suất không đổi theo
quy mô tức là thì

 Mất đa cộng tuyến vì đây là mô hình hồi quy đơn.
Ví dụ

Biết
Biến đổi

Với
3.2.2 Loại trừ một biến giải thích ra khỏi mô hình
Giả sử trong mô hình hồi quy của ta có Y là biến được giải thích còn là các biến giải thích. Chúng ta thấy
rằng tương quan chặt chẽ với X3. Khi đó nhiều thông tin về Y chứa ở thì cũng chứa ở . Vậy nếu ta bỏ 1 trong
2 biến hoặc khỏi mô hình hồi quy, ta sẽ giải quyết được vấn đề đa cộng tuyến nhưng sẽ mất đi 1 phần thông
tin về Y.
Bằng phép so sánh và trong các phép hồi quy khác nhau mà có và không có 1 trong 2 biến chúng ta có
thể quyết định nên bỏ biến nào trong biến X2 và X3 khỏi mô hình.
Thí dụ đối với hồi quy của Y đối với tất cả các biến là 0.94; khi loại biến là 0.87 và khi loại biến là
0.92; như vậy trong trường hợp này ta loại X3.
Chúng ta lưu ý 1 hạn chế của biện pháp này là trong các mô hình kinh tế có những trường hợp đòi hỏi nhất
định phải có biến này hoặc biến khác ở trong mô hình. Trong trường hợp như vậy việc loại bỏ 1 biến phải

được cân nhắc cẩn thận giữa sai lệch khi bỏ 1 biến cộng tuyến với việc tăng phương sai của các ước lượng
hệ số khi biến đó ở trong mô hình.
3.2.3 Bổ sung thêm dữ liệu hoặc chọn mẫu mới
Vì đa cộng tuyến là đặc trưng của mẫu nên có thể có mẫu khác liên quan đến cùng các biến trong mẫu
ban đầu mà đa cộng tuyến có thể không nghiêm trọng nữa. Điều này có thể làm được khi chi phí cho việc lấy
mẫu khác có thể chấp nhận được trong thực tế .
Đôi khi chỉ cần thu thập them số liệu , tăng cỡ mẫu có thể làm giảm tính nghiêm trọng của đa cộng tuyến

3.2.4 Dùng sai phân cấp một

Ví dụ chúng ta có số liệu chuỗi thời gian biểu thị liên hệ giữa các biến Y và các biến phụ thuộc X 2 và X3
theo mô hình sau:
Yt = β1 + β 2 X 2t + β 3X 3t+ U t

(1.19)

Trong đó t là thời gian. Phương trình trên đúng với t thì cũng đúng với t-1 nghĩa là:
Yt-1 = β 2 + β 2 X 2t-1+ β 3X 3t-1 + U t-1 (1.20)
Từ (1.19) và (1.20) ta được:
Yt – Yt-1 = β 2 (X2t - X2t-1) + β 3 (X3t - X3t-1) + Ut - Ut-1
Đặt

(1.21)

yt = Yt – Yt-1
x2t = X2t - X2t-1
x3t = X3t - X 3t-1
Vt = U t - U t-1

Ta được:

yt = β 2 x2t + β 3 x3t + Vt

(1.22)

Mô hình hồi quy dạng (1.22) thường làm giảm tính nghiêm trọng của đa cộng tuyến vì dù X 2 và X3 có
thể tương quan cao nhưng không có lý do tiên nghiệm nào chắc chắn rằng sai phân của chúng cũng tương quan
cao.

Tuy nhiên biến đổi sai phân bậc nhất sinh ra 1 số bấn đề chẳng hạn như số hạng sai số V t trong (1.22) có
thể không thỏa mãn giả thiết của mô hình hồi quy tuyến tính cổ điển là các nhiễu không tương quan.Vậy thì
biện pháp sửa chữa này có thể lại còn tồi tệ hơn căn bệnh.
3.2.5. Giảm tương quan trong hồi quy đa thức
Nét khác nhau của hồi quy đa thức là các biến giải thích xuất hiện với lũy thừa khác nhau trong mô hình hồi
quy. Trong thực tế để giảm tương quan trong hồi quy đa thức người ta thường sử dụng độ lệch. Nếu việc sử
dụng dạng độ lệch mà vần không giảm đa cộng tuyến thì người ta có thể phải xét đến kĩ thuật ‘ đa thức trực
giao’

3.2.6. Một số biện pháp khác
- Bỏ qua đa cộng tuyến nếu t>2
- Bỏ qua đa cộng tuyến nếu R2 của mô hìn cao hơn R2 của mô hình hồi quy phụ
- Bỏ qua đa cộng tuyến nếu hồi quy mô hình được dùng để dự báo chứ không phải kiểm định.
- Hồi quy thành phần chính
- Sử dụng ước lượng từ bên ngoài
Nhưng tất cả các biện pháp đã bày ra trên có thể làm giải pháp cho vấn đề đa cộng tuyến như thế nào còn phụ
thuộc vào bản chất của tập số liệu và tính nghiêm trọng của vấn đề đa cộng tuyến.
Nhưng tất cả các biện pháp đã trình bày ở trên có thể làm giải pháp cho vấn đề đa cộng tuyến như thế nào còn
phụ thuộc vào bản chất cua tập số liệu và tính nghiêm trọng của vấn đề đa cộng tuyến.
Phần II. Bài tập vận dụng
Dựa trên những cơ sở lý luận ta đã tìm hiểu, sau đây chúng ta cùng đi phân tích một tình huống kinh tế cụ thể để
thấy được cách phát hiện và khắc phục hiện tượng đa cộng tuyến
Theo một cuộc điều tra thể hiên sự phụ thuộc của lượng thịt gà tiêu dùng theo đầu người của Mỹ, giá bán lẻ
thực của thịt gà và giá bán lẻ thực của thịt lợn giai đoạn 1960-1982
Trong đó:
Y: lượng thịt gà tiêu dung theo đầu người (pounds)
X: thu nhập khả dụng theo đầu người ($)
Z: giá bán lẻ thực của thịt gà (cent/pounds)
T: giá bán lẻ thực thịt lợn (cent/pounds)
Nguồn: Robert J.Fisher (D.N. Gujarati)

Bảng số liệu về nhu cầu thịt gà ở Mỹ giai đoạn 1960 – 1982
Quan sát
1

Y
27.8

X
397.5

Z
42.2

T
78.3

2
3
4
5
6
7
8
9
10
11
12
13

14
15
16
17
18
19
20
21
22
23

29.9
28.8
30.8
31.2
33.3
35.6
36.4
36.7
38.4
40.4
40.3
41.8
40.4
40.7
40.1
42.7
44.1
46.7
50.6

50.1
51.7
52.9

413.3
439.2
459.7
492.9
528.6
560.3
624.6
666.4
717.8
768.2
843.3
911.6
931.1
1021.5
1165.9
1349.6
1449.4
1575.5
1759.1
1994.2
2258.1
2478.7

38.1
40.3
39.5

37.3
38.1
39.3
37.8
38.4
40.1
38.6
39.8
39.7
52.1
48.9
58.3
57.9
56.5
63.7
61.6
58.9
66.4
70.4

79.2
79.2
79.2
77.4
80.2
80.4
83.9
85.5
93.7
106.1

104.8
114
124.1
127.6
142.9
143.6
139.2
165.5
203.3
219.6
221.6
232.6

1. Lập mô hình hồi quy
Ta có mô hình hàm hồi quy tuyến tính

Mô hình hồi quy mẫu:

Từ bảng số liệu sử dụng phần mềm eviews ta được kết quả sau:

Từ kết quả ước lượng ta thu được mô hình hồi quy mẫu

2. Phát hiện hiện tượng đa cộng tuyến
a. R2 cao nhưng tỷ số t thấp
Ta có: R2=0.907952>0.8 => R2cao
tz= -1.755548 có Prob =0.0953>0.05 => tzthấp
Kết luận: Với mức ý nghĩa α = 5% có thể nói mô hình xảy ra hiện tượng đa cộng tuyến không hoàn hảo
b. Hồi quy phụ
Mô hình:

Hồi quy phụ:
Ta tiến hành hồi quy X theo Z và T, sử dụng phần mềm eview ta được số liệu như sau:

Mô hình hồi quy mẫu phụ có dạng:
= -588.2910 + 6.576722Zi +10.50950Ti
Với α=0.05, cần kiểm định :

Prob(F-statistic) =0.000000 < α, nên bác bỏ Ho, chấp nhận H1
Kết luận: MH xảy ra đa cộng tuyến không hoàn hảo
c. Tương quan cặp giữa các biến độc lập
Sử dụng phần mềm eview, ta được số liệu như sau:

│ρxz│= 0.931681 > 0.8
Kết luận: Có hiện tượng đa cộng tuyến không hoàn hảo cao
3. Khắc phục hiện tượng đa cộng tuyến

a. Thu thập thêm số liệu để tăng kích thước mẫu
Quansát
1
2
3
4
5
6
7
8
9

10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26

Y
27.8
29.9
28.8
30.8
31.2
33.3
35.6
36.4
36.7
38.4
40.4

40.3
41.8
40.4
40.7
40.1
42.7
44.1
46.7
50.6
50.1
51.7
52.9
45.7
53.7
53.1

X
397.5
413.3
439.2
459.7
492.9
528.6
560.3
624.6
666.4
717.8
768.2
843.3
911.6

931.1
1021.5
1165.9
1349.6
1449.4
1575.5
1759.1
1994.2
2258.1
2478.7
2351.8
2635.8
2595.2

Z
42.2
38.1
40.3
39.5
37.3
38.1
39.3
37.8
38.4
40.1
38.6
39.8
39.7
52.1
48.9

58.3
57.9
56.5
63.7
61.6
58.9
66.4
70.4
71.0
80.1
85.9

Từ bảng số liệu, dung phần mềm eview ta có kết quả như sau:

T
78.3
79.2
79.2
79.2
77.4
80.2
80.4
83.9
85.5
93.7
106.1
104.8
114
124.1
127.6

142.9
143.6
139.2
165.5
203.3
219.6
221.6
232.6
239.3
250.5
262.7

Từ bảng eview, ta có mô hình hàm hồi quy mẫu mới:

Có: R2= 0.890428 > 0.8
có Prob = 0.0935 > 0.05 => thấp
Kết luận: Mô hình vẫn còn hiện tượng đa cộng tuyến, nhưng nó giảm tính nghiêm trọng của hiện tượng
b. Bỏ biến
Bước 1: Hồi quy Y theo Z và T
Sử dụng phần mềm eview ta có bảng sau:

Khi bỏ biến X ta có mô hình hồi quy:
=26.10947 – 0.140626Zi + 0.162870Ti
R12 = 0.876090
ttn = -0.991993 ứng với biến Z
ttn = 5.322251 ứng với biến T
Bước 2: Hồi quy Y theo X và T
Sử dụng phần mềm eview ta đươc bảng sau:

Khi bỏ biến Z ta có mô hình hồi quy:
=27.62956 + 0.010907Xi +0.005686Ti
R22 = 0.893021
ttn = 2.074913 ứng với biến X
ttn = 0.090169 ứng với biến T

Bước 3: Hồi quy Y theo X và Z
Dùng phần mềm eview, ta được bảng sau:

Khi bỏ biến T ta có mô hình hồi quy:
=34.59455+ 0.015062Xi – 0.219984Zi
R32 = 0.907251
ttn = 6.675541 ứng với biến X
ttn = -1.754361 ứng với biến Z
Bằng phép so sánh R2 trong các phép hồi quy trên mà có một trong 3 biến X, Z, T mà chúng ta quyết định nên
bỏ biến nào ra khỏi mô hình hồi quy:
- R2 khi loại bỏ biến X là: 0.876090
- R2khi loại bỏ biến Z là: 0.893021
- R2 khi loại bỏ biến T là: 0.907251
Như vậy trong trường hợp này chúng ta nên bỏ biến T, ta thấy R2 khi loại bỏ biến T > R2 khi loại bỏ biến Z >
R2 khi loại bỏ biến X, nên mô hình bỏ biến T có sự phù hợp cao hơn khi bỏ biến X, Z. Vậy ta nên bỏ biến T ra
khỏi mô hình mô hình vẫn còn hiện tượng đa cộng tuyến nhưng nó làm giảm tính nghiêm trọng của hiện tượng.
KẾT LUẬN
Có nhiều cách phát hiện và khắc phục hiện tượng đa cộng tuyến khác nhau. Mỗi phương pháp có những hạn
chế nhất định. Vì vậy, khi áp dụng một phương pháp nào ta cần cân nhắc kĩ lượng để mang lại kết quả tin cậy
nhất.

Phần III. Thảo luận
5.3: Phương sai sai số thay đổi
MH gốc:
Yi = β1 + β2Xi + Ui

(1)

TH1: σi2 đã biết
 Biến đổi MH gốc về MH nào? Tại sao?
Chia cả 2 vế của (1) cho σi, có:
= β 1 + β2 +

(2)

Var = E (2 = × E(Ui)2 = × = 1
= Var (Ui) = × = 1
 MH không còn hiện tượng PSSS thay đổi
 Dùng phương pháp nào để ước lượng MH khi biến đổi?
- Phương pháp bình phương nhỏ nhất để ước lượng (2)
- Phương pháp DOLS để ước lượng (1)
 Trọng số trong phương pháp trên là gì? Trong thực tế có thể thay trọng số trên bằng giá trị biến
nào?
Ta cực tiểu tổng bình phương các phần dư có trọng số:
)2 min
Trong đó là các ước lượng bình phương nhỏ nhất có trọng số, Wi được định nghĩa như sau:
Wi ( ; Var(
Bằng cách lý luận như trường hợp không có trọng số ta tìm được

Trong đó:

Rõ ràng khi Wii) thì trung bình trọng số bằng trung bình thông thường.
TH2: σi2 chưa biết
 Áp dụng giả thiết nào để khắc phục
- Giả thiết 1: E(Ui)2 = σ2Xi2 = Var(Ui)
- Giả thiết 2: E(Ui)2 = σ2Xi = Var(Ui)
- Giả thiết 3: E(Ui)2 = σ2 (E (Yi))2 = Var(Ui)
- Giả thiết 4: Dạng hàm sai
 Nêu cách khắc phục tương ứng? tại sao?
Giả thiết 3: E(Ui)2 = σ2 (E (Yi))2

MH gốc:

Yi = β1 + β2Xi + Ui

(1)

Chia cả 2 vế cho E(Yi), có:
= + β2 +

(2)

Thay E(Yi) = (thu được từ hồi quy mô hình (1))
Chứng minh mô hình (2) có Var () = σ2
 mô hình (2) không còn phương sai sai số thay đổi
Ví dụ:
1. Giả thiết: σ2 = σ2Xiα
Nêu cách khắc phục hiện tượng?
2. Có Var (Ui) = σ2XiαZβi
Xét MH: Yi = β1 + β2Xi + Ui + β3Zi

Nêu cách khắc phục hiện tượng?
 1. Yi = β1 + β2Xi + Ui
2.
Var ( Ui ) = Xi
6.3: Tự tương quan
 Phương pháp nào khắc phục tự tương quan bậc 1? Tại sao?
 Phương pháp sai phân tổng quát
Yi = β1 + β2Xi + Ui

(1)

Sai phân tổng quát:
Yi = ρYi-1 = β1(1-ρ) + β2(Xi – ρXi-1) + Ui ρUi-1
Ta có: εi = Ui – ρUi-1 thỏa mãn Cov(εi , ε’i) = 0
 MH (2) có tự tương quan bậc 1
Vì Ui = =>
 Nếu ρ chưa biết => dùng phương pháp nào?
- Phương pháp sai phân cấp 1: ρ = 1
- Ước lượng � dựa trên thống kê d- Durbin – Watson : ρ = 1 - Thủ tục lặp Cochrane - Orcult để ước lượng �
- Thủ tục Cochrane - Orcutt hai bước
- Phương pháp Durbin - Watson 2 bước để ước lượng �
- Các phương pháp khác để ước lượng �
 Xác định giá trị ước lượng của � trong mỗi phương pháp đó?

(2)

Giả sử MH gốc = + + có xảy ra hiện tượng tự tương quan bậc 1. Xác định giá trị ước lượng của � trong mỗi
phương pháp.
1.Phương pháp sai phân cấp 1

Ta có giả thiết
- �=0 tức là không có tương quan chuỗi
- �=(+-)1 nghĩa là có tương quan dương hoặc âm hoàn toàn
Khi ước lượng người ta thường giả thiết không có sự tương quan rồi sau đó kiểm định Durbin – Watson
hay các kiểm định khác xem đúng không. Tuy nhiên khi �=(+-)1 thì phương trình sai phân tổng quát
quy về phương trình sai phân cấp 1:
( *)
Trong đó là toán tử sai cấp 1. Để ước lượng hồi quy (*) ta sử dụng mô hình hồi quy qua gốc tọa độ.
-

Giả sử mô hình ban đầu là:

-

= + + + (**)
Trong đó t là biến xu thế, theo sơ đồ tự hồi quy bậc 1
Thực hiện phép biến đổi sai phân cấp 1 đối với (**) ta được:
(***)
Trong đó: và
Phương trình (***) có hệ số chặn dưới dạng sai phân cấp 1
Phép biến đổi sai phân cấp 1 đã giới thiệu trước đây rất phổ biến trong kinh tế lượng ứng dụng vì nó dễ
thực hiện. Nhưng lưu ý rằng đôi khi giả thiết chúng ta đưa ra sẽ không xảy ra. Chính vì vậy chúng ta đi
đến với những phương pháp khác dưới đây.

2. Ước lượng � dựa trên thống kê d- Durbin – Watson
Ta có: = 1- (a)
Đẳng thức này gợi cho ta cách đơn giản để thu được ước lượng � từ thống kê d
•
•
•

Giả thiết sai phân cấp 1 với �= 1 chỉ đúng khi d=0 hoặc xấp xỉ bằng 0
Khi d = 2 thì =0
Khi d = 4 thì = (-1)
Do vậy, thống kê d cung cấp cho ta một phương pháp sẵn có để thu được ước lượng �
Lưu ý: (a) chỉ là quan hệ xấp xỉ và có thể không đúng với các mẫu nhỏ. ĐỐi với các mẫu nhỏ co thể sử
dụng thống kê d để cải biên của Theil-Nagar. Vì vậy trong các mẫu nhỏ ta phải cẩn trọng khi giải thích
các kết quả ước lượng.
3. Thủ tục lặp Cochrane - Orcult để ước lượng �

Phương pháp này sử dụng phần đã được ước lượng để thu được thông tin về � chưa biết.
Ta xét phương pháp này thông qua mô hình hai biến sau:

= + + (1)
Giả sử =�+ ( 2 )
Các ước lượng � được tiến hành như sau:
• Ước lượng mô hình 2 biến bằng phương pháp bình phương nhỏ nhất thông thường và thu được phần dư
e1
• Sử dụng phần dư đã ước lượng để ước lượng hổi quy
-1+ = ( 3)
• Sử dụng thu được từ phương trình (3) để ước lương phương trình sai phần tổng quát:
- = (1 – ) + ) + ( - )
Ta ước lượng hồi quy:
*=+ *+* ( 4)
•

Vì chúng ta chưa biết thu được từ phương trình (1) có phải là ước lượng tốt nhất hay không nên ta thay
giá trị 1*và 2* thu được từ phương trình (4) vào hồi quy gốc ban đầu và thu được các phần dư mới
*-*

Ước lượng hồi quy tương tự ta thu được:

**+=**(5)
là ước lượng vòng 2 của �
4. Thủ tục Cochrane - Orcutt hai bước
Đây là một kiểu rút ngắn quá trình lặp. trong bước (1) ta ước lượng � từ bước lặp đầu tiên nghĩa là phép hồi quy
và trong bước (2) ta sử dụng ước lượng của � để ước lương phương trình sai phân tổng quát. Trong thực hành
hai bước này hoàn toàn cho ta kết quả tương tự với kết quả thu được từ thủ tục lặp kỹ lưỡng ở trên.
5. Phương pháp Durbin - Watson 2 bước để ước lượng �
Để minh hoạ phương pháp này chúng ta viết lại phương trình sai phân tổng quát dưới dang sau:
= (1 – �) + – � + � + (6)
Durbin đã đề xuất thủ tục 2 bước để ước lượng �
• Coi (6) như một mô hình hồi quy bội, hồi quy theo ,, và coi giá trị ước lượng được của hệ số hồi quy
(=�) là ước lượng của �
• Sau khi thu được , hãy đổi biến *= - và *=- và ước lượng hồi quy bằng phương pháp bình phương nhỏ
nhất thông thường
6. Các phương pháp khác để ước lượng �
Ngoài các phương pháp trên còn có một số phương pháp khác như dùng phương pháp hợp lý cực đại để ước
lượng trực tiếp tham số mà không cần dùng đến một số thủ tục lặp đã thảo luận

7.3. Đa cộng tuyến
 Liệt kê những phương pháp dùng để khắc phục hiện tượng đa cộng tuyến? Hiểu được ý tưởng
của mỗi phương pháp này
1. Dùng thông tin tiên nghiệm
Một trong các cách tiếp cận để giải quyết vấn đề đa cộng tuyến là phải tận dụng thông tin tiên nghiệm hoặc
thông tin từ nguồn khác để ước lượng các hệ số riêng.
Mô hình sản xuất Cobb-Douglas

Có thể xảy ra đa cộng tuyến do K và L cùng tăng theo quy mô sản xuất. Nếu biết hiệu suất không đổi theo

quy mô tức là thì

 Mất đa cộng tuyến vì đây là mô hình hồi quy đơn.
Ví dụ

Biết
Biến đổi

Với
2. Loại trừ một biến giải thích ra khỏi mô hình
Giả sử trong mô hình hồi quy của ta có Y là biến được giải thích còn là các biến giải thích. Chúng ta thấy
rằng tương quan chặt chẽ với X3. Khi đó nhiều thông tin về Y chứa ở thì cũng chứa ở . Vậy nếu ta bỏ 1 trong
2 biến hoặc khỏi mô hình hồi quy, ta sẽ giải quyết được vấn đề đa cộng tuyến nhưng sẽ mất đi 1 phần thông
tin về Y.
Bằng phép so sánh và trong các phép hồi quy khác nhau mà có và không có 1 trong 2 biến chúng ta có
thể quyết định nên bỏ biến nào trong biến X2 và X3 khỏi mô hình.
Thí dụ đối với hồi quy của Y đối với tất cả các biến là 0.94; khi loại biến là 0.87 và khi loại biến là
0.92; như vậy trong trường hợp này ta loại X3.

Chúng ta lưu ý 1 hạn chế của biện pháp này là trong các mô hình kinh tế có những trường hợp đòi hỏi nhất
định phải có biến này hoặc biến khác ở trong mô hình. Trong trường hợp như vậy việc loại bỏ 1 biến phải
được cân nhắc cẩn thận giữa sai lệch khi bỏ 1 biến cộng tuyến với việc tăng phương sai của các ước lượng
hệ số khi biến đó ở trong mô hình.
3. Bổ sung thêm dữ liệu hoặc chọn mẫu mới
Vì đa cộng tuyến là đặc trưng của mẫu nên có thể có mẫu khác liên quan đến cùng các biến trong mẫu
ban đầu mà đa cộng tuyến có thể không nghiêm trọng nữa. Điều này có thể làm được khi chi phí cho việc lấy
mẫu khác có thể chấp nhận được trong thực tế .
Đôi khi chỉ cần thu thập them số liệu , tăng cỡ mẫu có thể làm giảm tính nghiêm trọng của đa cộng tuyến

4. Dùng sai phân cấp một
Ví dụ chúng ta có số liệu chuỗi thời gian biểu thị liên hệ giữa các biến Y và các biến phụ thuộc X 2 và X3
theo mô hình sau:
Yt = β1 + β 2 X 2t + β 3X 3t+ U t

(1.19)

Trong đó t là thời gian. Phương trình trên đúng với t thì cũng đúng với t-1 nghĩa là:
Yt-1 = β 2 + β 2 X 2t-1+ β 3X 3t-1 + U t-1 (1.20)
Từ (1.19) và (1.20) ta được:
Yt – Yt-1 = β 2 (X2t - X2t-1) + β 3 (X3t - X3t-1) + Ut - Ut-1
Đặt

(1.21)

yt = Yt – Yt-1
x2t = X2t - X2t-1
x3t = X3t - X 3t-1
Vt = U t - U t-1

Ta được:

yt = β 2 x2t + β 3 x3t + Vt

(1.22)

Mô hình hồi quy dạng (1.22) thường làm giảm tính nghiêm trọng của đa cộng tuyến vì dù X 2 và X3 có
thể tương quan cao nhưng không có lý do tiên nghiệm nào chắc chắn rằng sai phân của chúng cũng tương quan
cao.

Tuy nhiên biến đổi sai phân bậc nhất sinh ra 1 số bấn đề chẳng hạn như số hạng sai số V t trong (1.22) có
thể không thỏa mãn giả thiết của mô hình hồi quy tuyến tính cổ điển là các nhiễu không tương quan.Vậy thì
biện pháp sửa chữa này có thể lại còn tồi tệ hơn căn bệnh.
5. Giảm tương quan trong hồi quy đa thức
Nét khác nhau của hồi quy đa thức là các biến giải thích xuất hiện với lũy thừa khác nhau trong mô hình hồi
quy. Trong thực tế để giảm tương quan trong hồi quy đa thức người ta thường sử dụng độ lệch. Nếu việc sử
dụng dạng độ lệch mà vần không giảm đa cộng tuyến thì người ta có thể phải xét đến kĩ thuật ‘ đa thức trực
giao’

6. Một số biện pháp khác
- Bỏ qua đa cộng tuyến nếu t>2
- Bỏ qua đa cộng tuyến nếu R2 của mô hìn cao hơn R2 của mô hình hồi quy phụ
- Bỏ qua đa cộng tuyến nếu hồi quy mô hình được dùng để dự báo chứ không phải kiểm định.
- Hồi quy thành phần chính
- Sử dụng ước lượng từ bên ngoài
Nhưng tất cả các biện pháp đã trình bày ở trên có thể làm giải pháp cho vấn đề đa cộng tuyến như thế nào còn
phụ thuộc vào bản chất cua tập số liệu và tính nghiêm trọng của vấn đề đa cộng tuyến.
 Nếu trong mô hình 3 biến có xảy ra hiện tượng ĐCT, thì phương pháp bỏ biến có luôn khắc phục
được hiện tượng này hay không? Vì sao? Có nên lạm dụng phương pháp bỏ biến hay không? Vì
sao?
* Biện pháp bỏ biến trong mô hình đa cộng tuyến là biện pháp đơn giản nhất. Ta thấy rằng hiện tượng đa cộng
tuyến xảy ra khi biến độc lập nào đó có biểu diễn tuyến tính hoặc gần tuyến tính qua các biến độc lập khác.Vì
vậy ta cần cân nhắc trong việc loại bỏ biến nào trong mô hình. Trong mô hình 3 biến có 1 biến phụ thuộc và 2
biến độc lập, khi dùng phương pháp bỏ biến thì chỉ còn duy nhất một biến độc lập nên không tồn tại mối tương
quan giữa các biến độc lập, không khắc phục được hiện tượng đa cộng tuyến. Khi áp dụng phương pháp bỏ biến
của mô hình 3 biến thì luôn loại bỏ được đa cộng tuyến nhưng mô hình không hiệu quả do chỉ còn một biến giải
thích. Hơn nữa trong một số mô hình có những biến là bắt buộc có trong mô hình không thể bỏ được.
⇒ không phải lúc nào cũng khắc phục được hiện tượng đa cộng tuyến bằng phương pháp bỏ biến
* Không nên lạm dụng phương pháp bỏ biến vì :việc bỏ một biến khỏi mô hình để làm giảm bớt vấn đề đa cộng

tuyến có thể sẽ dẫn đến việc có cái nhìn phiến diện về biến phụ thuộc. Vì vậy, phương pháp giải quyết có lẽ lại
còn làm cho vấn đề xấu thêm trong một số trường hợp, bởi vì, trong khi đa cộng tuyến có thể cản trở việc ước

lượng được chính xác các thông số của mô hình, thì việc bỏ qua một biến có lẽ làm cho chúng ta lạc hướng trầm
trọng khi tìm đến giá trị thực của các thông số. Hơn nữa có nhiều phương pháp khác để ta khắc phục đa cộng
tuyến trước khi sử dụng đến phương pháp bỏ biến.
 Nếu khắc phục đa cộng tuyến mà R 2 thu được từ mô hình mới khá thấp thì việc khắc phục hiện
tượng có thành công hay không? Trong những trường hợp nào có thể bỏ qua hiện tượng Đa cộng
tuyến
Khi khắc phục hiện tượng đa cộng tuyến nếu R2 thu được từ mô hình mới khá thấp (R2<0.8) thì phải làm t cao
lên mới khắc phục đa cộng tuyến thành công.
Trong trường hợp nào có thể bỏ qua hiện tượng ĐCT?
a) Bỏ qua đa cộng tuyến nếu |t| > 2
b) Bỏ qua đa cộng tuyến nếu R2 của mô hình cao hơn R2 của mô hình hồi qui phụ.
c) Bỏ qua đa cộng tuyến nếu mục tiêu xây dựng mô hình sử dụng để dự báo chứ không để phải kiểm định.

CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc lập - Tự do - Hạnh phúc
-------o0o-----BIÊN BẢN THẢO LUẬN NHÓM

Môn học: Kinh tế lượng
Đề tài: Phát hiện và khắc phục hiện tượng đa cộng tuyến
Các thành viên:
1. Nguyễn Thị Minh Vân (nhóm trưởng)

5. Vũ Thế Trọng

2. Đỗ Thị Thu Uyên (thư ký nhóm)

6. Trần Bảo Trung

3. Nguyễn Thị Quỳnh Trang

7. Lê Thị Tú

4. Nguyễn Thị Quỳnh Trang

8. Dương Sơn Tùng

Phát hiện và khắc phục hiện tượng đa cộng tuyến

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về