Tải bản đầy đủ (.pdf) (13 trang)

Bài giảng Kinh tế lượng: Chương 5 - ThS. Trần Quang Cảnh

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (542.28 KB, 13 trang )

5.1 KHÁI NIỆM

CHƯƠNG 5

• Biến định lượng: các giá trị quan sát được thể
hệ bằng con số
• Biến định tính: thể hiện một số tính chất nào
đó
• Để đưa những thuộc tính của biến định tính
vào mô hình hồi quy, cần lượng hóa chúng =>
sử dụng biến giả (dummy variables)

BIẾN GIẢ TRONG PHÂN TÍCH HỒI QUY

4

1

4

5.2. MÔ HÌNH TRONG ĐÓ BIẾN GiẢI
THÍCH ĐỀU LÀ BIẾN GiẢ

BIẾN GIẢ

1.
MỤC
TIÊU

Biết


cách

đặt

biến

• Ví dụ: khảo sát năng suất của 2 công nghệ,
người ta thu được các số liệu cho ở bảng sau:

giả

Zi

2. Nắm phương pháp sử dụng
biến giả trong phân tích hồi quy

B

A

A

B

B

A

B


A

A

B

Yi 28 32 35 27 25 37 29 34 33 30
Trong đó Yi : năng suất
Zi: công nghệ tương ứng
5

2

2

5

NỘI DUNG
1

Khái niệm biến giả

2

Sử dụng biến giả trong mô hình hồi quy

3

Kỹ thuật sử dụng biến giả


5.2. MÔ HÌNH TRONG ĐÓ BIẾN GiẢI
THÍCH ĐỀU LÀ BIẾN GiẢ
Di: là biến giả
Di = 1 nếu là công nghệ A
Di = 0 nếu là công nghệ B
Ta có bảng số liệu như sau
Di

0

1

1

0

0

1

0

1

1

0

Yi 28 32 35 27 25 37 29 34 33 30
6


3

6

1


5.3. HỒI QUY VỚI MỘT BIẾN ĐỊNH LƯỢNG VÀ
MỘT BIẾN ĐỊNH TÍNH

5.2. MÔ HÌNH TRONG ĐÓ BIẾN GiẢI
THÍCH ĐỀU LÀ BIẾN GiẢ
Sử dụng mô hình hồi quy
Yi = β1 + β2Di + Ui (hãy tìm hàm hồi quy mẫu ?)
•Như vậy β1 + β2 biểu hiện năng suất trung bình
của công nghệ A
•β2 phản ánh chênh lệch năng suất trung bình
giữa công nghệ B và công nghệ A
•β2 = 0 chính là giả thiết cho rằng giũa công nghệ
A và công nghệ B không có sự khác biệt

• Ví dụ: khảo sát lượng hàng bán được ở một cửa
hàng, người ta thu được các số liệu cho ở bảng sau:
Yi

20

19


18

18

17

17

16 16

15

15

14

14

13

12

12

15 16

12

10


11

xi

2

3

3

4

4

3

4

4

5

5

5

6

6


7

7

5

4

7

8

8

1

0

1

0

1

1

0

1


1

1

0

1

0

1

0

1

0

1

0

1

Di

Trong đó Yi : Lượng hàng bán được (tấn/tháng)
Xi: giá bán
Di: Khu vực khảo sát: Di = 0 nếu khu vực khảo sát ở
nông thôn, Di = 1 nếu khu vực khảo sát ở thành phố


7

7

10

10

5.3. HỒI QUY VỚI MỘT BIẾN ĐỊNH LƯỢNG VÀ
MỘT BIẾN ĐỊNH TÍNH
Sử dụng mô hình hồi quy
Yi = β1 + β2Xi + β3Di + Ui
Yi = β1 + β2Xi (mô hình 1) lượng bán ở khu vực nông thôn
Yi = β1 + β2Xi + β3 (mô hình 2) lượng bán ở khu vực thành
thị
β3 biểu thị mức chênh lệch về lượng bán ở khu vực nông
và thành thị
Ý nghĩa của β2 ?
Β3 = 0 ?

5.2. MÔ HÌNH TRONG ĐÓ BIẾN GiẢI
THÍCH ĐỀU LÀ BIẾN GiẢ
Sử dụng số liệu ở bảng trên, tìm hàm hồi quy
tuyến tính mẫu Y theo D:
Ŷi = 27,8 + 6,4Di
Năng suất trung bình của công nghệ A ?
Năng suất trung bình của công nghệ B ?

8


8

11

11

5.2. MÔ HÌNH TRONG ĐÓ BIẾN GiẢI
THÍCH ĐỀU LÀ BIẾN GiẢ
Chú ý: để phân biệt m mức độ người ta dùng
m-1 biến giả để tránh hiện tượng đa cộng tuyến.
f

9

9

12

12

2


5.3. HỒI QUY VỚI MỘT BIẾN ĐỊNH LƯỢNG VÀ
MỘT BIẾN ĐỊNH TÍNH

5.4. HỒI QUY VỚI MỘT BIẾN ĐỊNH LƯỢNG VÀ
HAI BIẾN ĐỊNH TÍNH


Với ví dụ trên: giả sử khu vực khảo sát được chia làm ba
vùng khác nhau gồm thành thị, nông thôn, miền núi.
Chúng ta sử dụng mấy biến giả?
Chúng ta sử dụng mô hình sau
Yi = β1 + β2Xi + β3D1i + β4D2i + Ui
Trong đó Yi : Lượng hàng bán được (tấn/tháng)
Xi: giá bán; Di: Khu vực khảo sát: với 2 biến giả D1i và D2i
D1i = 1 nếu khu vực khảo sát ở nông thôn, D1i = 0 nếu khu
vực khảo sát ở nơi khác,
D2i = 1 nếu khu vực khảo sát ở thành phố, D2i = 0 nếu khu
13
vực khảo sát ở nơi khác

Ta đặt Yi: thu nhập
Xi: số năm kinh nghiệm, D1i = 1: nhân viên có trình độ đại học, D2i =
1 nhân viên có trình độ trên đại học, D3i = 1: nhân viên nam.
(D1i = 0, D2i = 0, D3i = 0): Nữ dưới đại học – phạm trù cơ sở
nam dưới đại học, nữ đại học, nam đại học, nữ sau đại học, nam
sau đại học?
(D1i = 0, D2i = 0, D3i = 1): Nam dưới đại học
(D1i = 1, D2i = 0, D3i = 0): Nữ đại học;
(D1i = 1, D2i = 0, D3i = 1): Nam đại học;
(D1i = 0, D2i = 1, D3i = 0 ): Nữ sau đại học
(D1i = 0, D2i = 1, D3i = 1): Nam sau đại học;

13

16

16


5.3. HỒI QUY VỚI MỘT BIẾN ĐỊNH LƯỢNG VÀ
MỘT BIẾN ĐỊNH TÍNH
Như vậy
Lượng bán trung bình của một cửa hàng ở miền núi là
phạm trù cơ sở (D1i = D2i = 0) ta có
Yi = β1 + β2Xi + Ui
Lượng bán trung bình của một cửa hàng ở nông thôn là
(D1i= ?; D2i= ?) ta có
Yi = β1 + β2Xi + β3 + Ui
Lượng bán trung bình của một cửa hàng ở thành phố là
(D1i= ?; D2i= ?) ta có
Yi = β1 + β2Xi + β4 + Ui

5.4. HỒI QUY VỚI MỘT BIẾN ĐỊNH LƯỢNG VÀ
HAI BIẾN ĐỊNH TÍNH
Mô hình hồi quy tổng quát như sau:
Yi = β1 + β2Xi + β3D1i + β4D2i + β5D3i + Ui
Thu nhập của nữ có trình độ dưới đại học:
E(Y/X, D1i = 0, D2i = 0, D3i = 0) = β1 + β2Xi + Ui
Thu nhập của nam có trình độ dưới đại học: ?
E(Y/X, D1i = 0, D2i = 0, D3i = 1) = β1 + β2Xi + β5 + Ui
Thu nhập của nữ có trình độ đại học:
E(Y/X, D1i = 1, D2i = 0, D3i = 0) = β1 + β2Xi + β3+ Ui

14

14

17


17

5.4. HỒI QUY VỚI MỘT BIẾN ĐỊNH LƯỢNG VÀ
HAI BIẾN ĐỊNH TÍNH
Giả sử chúng ta muốn ước lượng mức thu nhập của nhân
viên bán hàng được quyết định bởi số năm kinh nghiệm,
trình độ học vấn (dưới đại học, đại học, trên đại học) và
giới tính nam hay nữ (để xem giới tính có ảnh hưởng thu
nhập hay không). Mấy phạm trù, đặt máy biến giả ?

5.4. HỒI QUY VỚI MỘT BIẾN ĐỊNH LƯỢNG VÀ
HAI BIẾN ĐỊNH TÍNH
Thu nhập của nam có trình độ đại học:
E(Y/X, D1i = 1, D2i = 0, D3i = 1) = β1 + β2Xi + β3+ β5+ Ui
Thu nhập của nữ có trình độ sau đại học:
E(Y/X, D1i = 0, D2i = 1, D3i = 0) = β1 + β2Xi + β4 + Ui
Thu nhập của nam có trình độ sau đại học:
E(Y/X, D1i = 0, D2i = 1, D3i = 1) = β1 + β2Xi + β4 + β5+ Ui

15

15

18

18

3



5.4. HỒI QUY VỚI MỘT BIẾN ĐỊNH LƯỢNG VÀ
HAI BIẾN ĐỊNH TÍNH

5.6. BIẾN GiẢ VỚI TUNG ĐỘ GỐC VÀ HỆ SỐ
GÓC KHÁC NHAU

Từ mô hình trên ta có thể so sánh mức thu nhập với nhiều
trường hợp khác nhau
-Giữa nhân viên nữ có bằng đại học với nhân viên nữ
không có bằng đại học.
-Giữa nhân viên nữ có bằng đại học với nhân viên nữ có
bằng trên đại học.
-Giữa nhân viên nữ có bằng đại học với nhân viên nam có
bằng đại học.
-Giữa nhân viên nam có bằng đại học với nhân viên nam
không có bằng đại học…

Tiếp tục với ví dụ trên.
Giả sử lương khới điểm của nhân viên nữ (chưa có thâm
niên hay X = 0); là β1;
Lương khởi điểm của nhân viên nam (chưa có thâm niên
hay X = 0) khác lương khởi điểm của nhân viên nữ một
khoản là α1 tức lương khởi điểm của nhân viên nam là (β1
+ α1 )
Mô hình tổng quát trở thành:
Yi = (β1 + α1Di )+ (β2 + α2 Di )Xi + Ui
(Hay: Yi = β1 + α1Di + β2 Xi + α2 Di Xi + Ui)

19


19

22

22

5.5. BIẾN GiẢ VỚI HỆ SỐ GÓC KHÁC NHAU
Giả sử ta hồi quy thu nhập (biến Y) của nhân viên nam và
nữ, có mức lương khởi điểm (β1) và thâm niên công tác
(Biến X). Trong đó thâm niên công tác như nhau nhưng
tốc độ tăng lương giữa nam và nữ có thể khác nhau.
Giả sử đặt hệ số tăng lương của nhân viên nữ là β2 , hệ số
tăng lương của nhân viên nam khác nhân viên nữ một
khoảng α2 tức hệ số tăng lương của nhân viên nam là (β2 +
α2)

20

20

23

23

Bài tập:
Mã hóa bảng số liệu dưới đây và tìm hàm hồi quy mẫu

5.5. BIẾN GiẢ VỚI HỆ SỐ GÓC KHÁC NHAU
Thu nhập của nhân viên nữ:

Yi = β1 + β2Xi + Ui
Thu nhập của nhân viên nam: Yi = β1 + (β2 + α2) Xi + Ui
Nếu đặt Di là biến giới tính với Di = 1 nếu là nam, Di = 0
nếu là nữ,
Mô hình tổng quát trở thành:
Yi = β1 + (β2 + α2 Di )Xi + Ui
(Hay: Yi = β1 + β2 Xi + α2 Di Xi + Ui)
α2 > 0 tốc độ tăng thu nhập của nhân viên nam nhanh
hơn nhân viên nữ, α2 < 0 tốc độ tăng thu nhập của nhân
viên nam chậm hơn nhân viên nữ.

Quy Chi tiêu của Trình độ văn Tuổi của Giới tính
Mã hộ mô hộ
hộ
hóa của chủ hộ chủ hộ
chủ hộ
Yi
38820
4
10097.37
3
48
Nam
38818
6
14695.2
8
42
Nữ
38817

8
11733.34
4
37
Nữ
38816
3
7087.489
0
21
Nữ
38815
9
22809.3
6
48
Nữ
38813
4
9554.563
2
76
Nữ
11212
7
69258.09
9
42
Nữ
11211

3
13680.91
0
77
Nữ
11209
3
27651.65
13
32
Nữ
11208
4
32102.67
8
47
Nữ
11207
2
11464.6
7
38
Nam
11206
4
17199.63
5
93
Nam


21

21

Nơi sinh
sống
Nông thôn
Nông thôn
Nông thôn
Nông thôn
Nông thôn
Nông thôn
Thành thị
Thành thị
Thành thị
Thành thị
Thành thị
Thành thị
24

24

4


Bài tập:
Mã hóa bảng số liệu dưới đậy và tìm hàm hồi quy mẫu
Quy Chi tiêu của Trình độ văn Tuổi của Giới tính
Mã hộ mô hộ
hộ

hóa của chủ hộ chủ hộ
chủ hộ
X1i
Yi
X2i
X3i
D1i
38820
4
10097.37
3
48
1
38818
6
14695.2
8
42
0
38817
8
11733.34
4
37
0
38816
3
7087.489
0
21

0
38815
9
22809.3
6
48
0
38813
4
9554.563
2
76
0
11212
7
69258.09
9
42
0
11211
3
13680.91
0
77
0
11209
3
27651.65
13
32

0
11208
4
32102.67
8
47
0
11207
2
11464.6
7
38
1
11206
4
17199.63
5
93
1

5.9. HỒI QUY TUYẾN TÍNH TỪNG KHÚC

Nơi sinh
sống
D2i
0
0
0
0
0

0
1
1
1
1
1
1
25

25

28

28

5.7. BIẾN GiẢ TRONG PHÂN TÍCH THỜI VỤ

5.10. HỒI QUY BiẾN PHỤ THUỘC LÀ BiẾN GiẢ

26

26

29

29

5.8. KiỂM ĐỊNH TÍNH ĐỊNH CẤU TRÚC CỦA
CÁC MÔ HÌNH


27

27

30

30

5


Chi tiêu của hộ = α + β1* quy mô hộ + β2*trình độ văn hóa của
chủ hộ+ β3* tuổi của chủ hộ + β4* giới tính của chủ hộ β5* nơi
sinh sống của hộ

Mã hộ
38820
38818
38817
38816
38815
38813
11212
11211
11209
11208
11207
11206

Quy

mô hộ
4
6
8
3
9
4
7
3
3
4
2
4

Chi tiêu của hộ
10097.37
14695.2
11733.34
7087.489
22809.3
9554.563
69258.09
13680.91
27651.65
32102.67
11464.6
17199.63

Trình độ
văn hóa

của chủ
hộ
3
8
4
0
6
2
9
0
13
8
7
5

Tuổi
của
chủ
hộ
48
42
37
21
48
76
42
77
32
47
38

93

Giới
tính
chủ hộ
Nam
Nữ
Nữ
Nữ
Nữ
Nữ
Nữ
Nữ
Nữ
Nữ
Nam
Nam

Nơi sinh sống
Nông thôn
Nông thôn
Nông thôn
Nông thôn
Nông thôn
Nông thôn
Thành thị
Thành thị
Thành thị
Thành thị
Thành thị

Thành thị

Ví dụ
Mã hộ
Quy mô hộ
38820
38818
38817
38816
38815
38813
11212
11211
11209
11208
11207
11206

4
6
8
3
9
4
7
3
3
4
2
4


Chi tiêu
Trình độ văn Tuổi của
của hộ
hóa của chủ hộ chủ hộ
10097.37
3
14695.2
8
11733.34
4
7087.489
0
22809.3
6
9554.563
2
69258.09
9
13680.91
0
27651.65
13
32102.67
8
11464.6
7
17199.63
5


48
42
37
21
48
76
42
77
32
47
38
93

Nghề nghiệp
chủ hộ
Bác sĩ
Giáo viên
Nông dân
Bác sĩ
Giáo viên
Nông dân
Bác sĩ
Giáo viên
Nông dân
Bác sĩ
Giáo viên
Nông dân

31


31

34

34

Ví dụ

Ví dụ
1. Nghề nghiệp có 3 nghề (3 phạm trù)
2. Chọn 1 nghề làm phạm trù cơ sở
Ví dụ: chọn bác sĩ
3. Hai nghề còn lại là hai biến mới
Vậy số biến mới = số phạm trù -1
4. Biến Giáo viên nhận 2 giá trị: 1 nếu là
giáo viên; 0 nếu không phải là giáo viên
5. Biến Nông dân nhận 2 giá trị: 1 nếu là
nông dân; 0 nếu không phải là nông dân

• Có hai biến độc lập định tính là giới tính của chủ
hộ và nơi sinh sống của hộ. Để phân tích hồi quy
cần phải lượng hóa hai biến định tính này.
• Thực hiện: Giới tính gồm hai biểu hiện là nam và
nữ và mã hóa như sau: Nam=1, Nữ=0.
• Nơi sinh sống của hộ gồm thành thị và nông thôn
nên mã hóa như sau: Thành thị=1, Nông thôn=0.
(Việc chọn số mã hóa tùy nhà phân tích).

32


32

35

35

Dữ liệu đã mã hóa
Mã hộ Quy mô hộ
38820
4
38818
6
38817
8
38816
3
38815
9
38813
4
11212
7
11211
3
11209
3
11208
4
11207
2

11206
4

Trình độ văn
Chi tiêu của hóa của chủ Tuổi của Giới tính Nơi sinh
hộ
chủ hộ chủ hộ sống
hộ
10097.37
3
48
1
0
14695.2
8
42
0
0
11733.34
4
37
0
0
7087.489
0
21
0
0
22809.3
6

48
0
0
9554.563
2
76
0
0
69258.09
9
42
0
1
13680.91
0
77
0
1
27651.65
13
32
0
1
32102.67
8
47
0
1
11464.6
7

38
1
1
17199.63
5
93
1
1

Quy
Mã hộ mô hộ
###
4
###
6
###
8
###
3
###
9
###
4
###
7
###
3
###
3
###

4
###
2
###
4

33

33

Chi Trình độ
tiêu văn hóa
Nghề
của của chủ Tuổi của nghiệp chủ
hộ
hộ
chủ hộ
hộ
Giáo viên
###
3
48
Bác sĩ 0
###
8
42 Giáo viên 1
###
4
37 Nông dân 0
###

0
21
Bác sĩ 0
###
6
48 Giáo viên 1
###
2
76 Nông dân
###
9
42
Bác sĩ
###
0
77 Giáo viên
###
13
32 Nông dân
###
8
47
Bác sĩ
###
7
38 Giáo viên
###
5
93 Nông dân


Nông
dân
0
0
1
0
0

36

36

6


5.2 Sử dụng biến giả trong mô hình hồi quy

Câu hỏi
• Nếu có thêm nghề kế toán thì sao?

Y (thu nhập)

X (số năm)

4

3

D (nơi làm
việc)

1

5

5

0

3

3

0

6

4

1

7

5

1

37

37


40

40

5.2 Sử dụng biến giả trong mô hình hồi quy

HỒI QUY VỚI BiẾN ĐỊNH TÍNH
Quy tắc: Nếu biến định tính có m biểu hiện thì
sử dụng m-1 biến.
Ví dụ: Tổng chi tiêu của hộ phụ thuộc vào
(1) Giới tính của chủ hộ
(2) Số thành viên trong hộ
(3) Vùng nơi hộ sinh sống (có 8 vùng)
Biến định tính là biến nào?

E(Y/X,D) = 1 + 2Xi + 3Di

(5.1)

E(Y/X,D=0) = 1 + 2Xi

(5.2)

E(Y/X,D=1) = 1 + 2Xi + 3

(5.3)

(5.2): tiền lương trung bình của công nhân làm
việc trong khu vực quốc doanh với bậc thợ là X
(5.3): tiền lương trung bình của công nhân làm

việc trong khu vực tư nhân với bậc thợ là X
38

38

41

41

5.2 Sử dụng biến giả trong mô hình hồi quy

5.2 Sử dụng biến giả trong mô hình hồi quy

Ví dụ 5.1: Xét mô hình Yi = 1 + 2Xi + 3Di + Ui
với

2

tốc độ tăng lương theo bậc thợ

3

chênh lệch tiền lương trung bình của công

Y

Tiền lương (triệu đồng/tháng)

nhân làm việc ở hai khu vực và cùng bậc thợ


X

Bậc thợ

(Giả thiết của mô hình: tốc độ tăng lương theo

D=1 nếu công nhân làm trong khu vực tư nhân

bậc thợ ở hai khu vực giống nhau)

D=0 nếu công nhân làm trong khu vực nhà nước
D được gọi là biến giả trong mô hình
39

39

42

42

7


5.2 Sử dụng biến giả trong mô hình hồi quy

E(Y/X,Z) = 1 + 2Xi + 3Di

E(Y/X,Z1,Z2) = 1 + 2Xi + 3Z1i + 4Z2i
E(Y/X,Z1=0,Z2=0) = 1 + 2Xi
E(Y/X,Z1=1,Z2=0) = 1 + 2Xi + 3

E(Y/X,Z1=0,Z2=1) = 1 + 2Xi + 4
• 3 chênh lệch thu nhập trung bình của nhân
viên làm việc tại DNNN và DNLD khi có cùng
thời gian làm việc X năm
• 4 chênh lệch thu nhập trung bình của nhân
viên làm việc tại DNTN và DNLD khi có cùng thời
gian làm việc X năm

Y

ˆ1  ˆ 3

ˆ

ˆ 3

1

X

Hình 5.1 mức thu nhập bình quân tháng của người lao động tại
KVQD và KVTN khi có bậc thợ là X
43

46

43

46


5.2 Sử dụng biến giả trong mô hình hồi quy

5.2 Sử dụng biến giả trong mô hình hồi quy

Ví dụ 5.2: Xét sự phụ thuộc của thu nhập (Y)
(triệu đồng/tháng) vào thời gian công tác (X)
(năm) và nơi làm việc của người lao động
(DNNN, DNTN và DNLD)
Dùng 2 biến giả Z1 và Z2 với
Z1i =1
nơi làm việc tại DNNN
Z1i =0
nơi làm việc tại nơi khác
Z2i =1
nơi làm việc tại DNTN
Z2i =0
nơi làm việc tại nơi khác
Z1i = 0 và Z2i = 0

Ví dụ 5.3. thu nhập còn phụ thuộc vào trình độ
người lao động (từ đại học trở lên, cao đẳng và
khác)

1: nếu trình độ từ đại học trở lên
0: trường hợp khác
1: nếu trình độ cao đẳng
D2i =
0: trường hợp khác
Một chỉ tiêu chất lượng có n phạm trù (thuộc
tính) khác nhau thì dùng n-1 biến giả

D1i =

phạm trù cơ sở
44

47

44

47

5.2 Sử dụng biến giả trong mô hình hồi quy

5.2 Sử dụng biến giả trong mô hình hồi quy

Giả sử Y, X là biến định lượng, Z là biến giả (định tính)

Y (thu
X (số
nhập)
năm)
4
3

Nơi làm
Z1
việc
DNNN
1


Z2
0

TH1: Y= 1 + 2Z + 3X + U

5

5

DNTN

0

1

TH2: Y= 1 + 2X + 3(ZX) + U

3

3

DNLD

0

0

6

4


DNTN

0

1

7

5

DNNN

1

0

TH3: Y= 1 + 2Z + 3X + 4(ZX)+ U

45

45

48

48

8



5.2 Sử dụng biến giả trong mô hình hồi quy

5.2 Sử dụng biến giả trong mô hình hồi quy

VD 5.4: Khảo sát lương của nhân viên theo
số năm kinh nghiệm và giới tính

Y

Yˆ  ˆ 1  ˆ 2  ˆ 3 X

TH1: Y= 1 + 2Z + 3X + U

Yˆ  ˆ 1  ˆ 3 X

TH2: Y= 1 + 2X + 3(ZX) + U
ˆ 1  ˆ 2

TH3: Y= 1 + 2Z + 3X + 4(ZX)+ U

Trong đó
Y
lương
X
số năm kinh nghiệm
Z
giới tính với Z=1: nam; Z=0: nữ

ˆ 1 , ˆ 2 , ˆ 3  0
ˆ


1

0
X
Hình 5.2 Lương khởi điểm của nv nam và nữ khác nhau
49

49

52

52

5.2 Sử dụng biến giả trong mô hình hồi quy

5.2 Sử dụng biến giả trong mô hình hồi quy

TH1: Lương khởi điểm của nv nam và nữ
khác nhau nhưng tốc độ tăng lương theo số
năm kinh nghiệm như nhau

TH2: Lương khởi điểm như nhau nhưng
tốc độ tăng lương khác nhau
Hàm PRF:
Y= 1 + 2X + 3(ZX) + U

TH2: Lương khởi điểm như nhau nhưng
tốc độ tăng lương khác nhau


Với ZX gọi là biến tương tác
Hàm SRF ứng với nữ (Z=0) :

Yˆ  ˆ 1  ˆ 2 X

TH3: Lương khởi điểm và tốc độ tăng
lương khác nhau

Hàm SRF ứng với nam (Z=1) :
Yˆ  ˆ 1  ˆ 2 X  ˆ 3 X  ˆ 1  ( ˆ 2  ˆ 3 ) X

50

50

53

53

5.2 Sử dụng biến giả trong mô hình hồi quy

5.2 Sử dụng biến giả trong mô hình hồi quy

TH1: Lương khởi điểm của nv nam và nữ
khác nhau nhưng tốc độ tăng lương theo số
năm kinh nghiệm như nhau

Y

Yˆ  ˆ 1  ( ˆ 2  ˆ 3 ) X


Yˆ  ˆ 1  ˆ 2 X

Hàm PRF: Y= 1 + 2Z + 3X + U
ˆ 1 , ˆ 2 , ˆ 3  0

Hàm SRF ứng với nữ (Z=0) :

Yˆ  ˆ 1  ˆ 3 X

ˆ 1
0

Hàm SRF ứng với nam (Z=1) :

Yˆ  ˆ 1  ˆ 2  ˆ 3 X

51

X

Hình 5.3 Mức tăng lương theo số năm kinh nghiệm của nv nam và nữ khác
nhau
51

54

54

9



5.3 Ứng dụng sử dụng biến giả

5.2 Sử dụng biến giả trong mô hình hồi quy

5.3.1 Sử dụng biến giả trong phân tích mùa
Y
chi tiêu cho tiêu dùng
X
thu nhập
Z = 1 nếu quan sát trong mùa (tháng 1-6)
Z = 0 nếu quan sát không nằm trong mùa (tháng 7-12)

TH3: Lương khởi điểm và tốc độ tăng lương
khác nhau
Hàm PRF: Y= 1 + 2Z + 3X + 4(ZX)+ U
Hàm SRF ứng với nữ (Z=0) :

TH1: Nếu yếu tố mùa chỉ
ảnh hưởng đến hệ số
chặn

Yˆ  ˆ 1  ˆ 3 X
Hàm SRF ứng với nam (Z=1) :

Yˆ  ˆ1  ˆ2  ˆ3 X  ˆ4 X  ( ˆ1  ˆ2 )  ( ˆ3  ˆ4 ) X

Yˆi  ˆ1  ˆ2 Xi  ˆ3Zi


TH2: Nếu yếu tố mùa có
ảnh hưởng đến hệ số
góc

Yˆi  ˆ1  ˆ2 X i  ˆ3 Z i  ˆ4 X i Z i (*)

Mô hình * có tính tổng quát hơn. Qua việc kiểm định
giả thiết để biết được hệ số góc nào có ý nghĩa.

55

55

58

58

Ví dụ
Có bảng số liệu sau về doanh số bán từng quý
(triệu đồng). Hãy sắp xếp lại số liệu, sử dụng biến
giả và viết mô hình hồi quy.

5.2 Sử dụng biến giả trong mô hình hồi quy
Y

Yˆ  (ˆ1  ˆ2 )  (ˆ3  ˆ4 ) X

Năm
1970
1970

1970
1970
1971
1971
1971

Yˆ  ˆ 1  ˆ 3 X
ˆ 1  ˆ 2

ˆ 1 , ˆ 2 , ˆ 3 , ˆ 4  0
ˆ 1
0

X

Quý
1
2
3
4
1
2
3

Doanh số
992.7
1077.6
1185.9
1326.4
1434.2

1549.2
1718

Năm
1971
1972
1972
1972
1972
1973
1973

Quý
4
1
2
3
4
1
2

Doanh số
1918.3
2163.9
2417.8
2631.7
2957.8
3069.3
3304.8


Hình 5.4 Lương khởi điểm và mức tăng lương của nv nam và nữ khác nhau
56

56

59

59

Ví dụ
Năm
1970
1970
1970
1970
1971
1971
1971
1971
1972
1972
1972
1972
1973
1973
57

57

Quý

1
2
3
4
1
2
3
4
1
2
3
4
1
2

Doanh số
992.7
1077.6
1185.9
1326.4
1434.2
1549.2
1718
1918.3
2163.9
2417.8
2631.7
2957.8
3069.3
3304.8


D2
0
1
0
0
0
1
0
0
0
1
0
0
0
1

D3
0
0
1
0
0
0
1
0
0
0
1
0

0
0

D4
0
0
0
1
0
0
0
1
0
0
0
1
0
0
60

60

10


Kiểm định Chow
Giả thiết: H0: Hai hàm (5.3.1) và (5.3.2) giống nhau
B1: Gộp hai nhóm quan sát n=n1+n2 và tính RSS
có bậc tự do df= n1+n2-k từ mô hình hồi quy


Yi  1  2 Xi U2i
B2: Ước lượng (5.3.1) và (5.3.2) và thu được
RSS1 có df = n1-k, RSS2 có df = n2-k. Đặt
RSS*=RSS1+RSS2
B3: Tính
RSS  RSS* / k

F





*

RSS /(n1  n2  2k)

B4: Nếu F > Fα(k, n1+n2-2k): bác bỏ H0
Viết mô hình hồi quy mẫu và ý nghĩa các hệ số

61

61

64

64

5.3 Ứng dụng sử dụng biến giả
5.3.2 Kiểm định tính ổn định cấu trúc của các mô hình hồi quy

Ví dụ 5.5. Số liệu tiết kiệm (Y) và thu nhập cá nhân (X) ở nước
Anh từ 1946-63 (triệu pounds)
TK I
1946
1947
1948
1949
1950
1951
1952
1953
1954

Tiết kiệm Thu nhập TK II
Tiết kiệm Thu nhập
0.36
8.8
1955
0.59
15.5
0.21
9.4
1956
0.9
16.7
0.08
10
1957
0.95
17.7

0.2
10.6
1958
0.82
18.6
0.1
11
1959
1.04
19.7
0.12
11.9
1960
1.53
21.1
0.41
12.7
1961
1.94
22.8
0.5
13.5
1962
1.75
23.9
0.43
14.3
1963
1.99
25.2

65

62

62

65

5.3 Ứng dụng sử dụng biến giả
Mục tiêu: Kiểm tra hàm tiết kiệm có thay đổi cấu
trúc giữa 2 thời kỳ hay không.
Cách 1 Lập hai mô hình tiết kiệm ở 2 thời kỳ
Thời kỳ tái thiết: 1946-54
(5.3.1)
Yi  1 2 X i U1i
Thời kỳ hậu tái thiết: 1955-63

Yi  1  2 X i U2i

(5.3.2)

Và kiểm định các trường hợp sau

 1  1
 2  2

 1  1
 2  2

 1  1

 2  2

 1  1
 2  2
66

63

63

66

11


5.3 Ứng dụng sử dụng biến giả

Kết quả hồi quy theo mô hình như sau

Yi  1,75  0,15045X i  1,4839Z i  0,1034X i Zi  ei
t = (-5,27) (9,238)
p = (0,000) (0,000)

(3,155)
(0,007)

(-3,109)
(0,008)

Nhận xét

•Tung độ gốc chênh lệch và hệ số góc chênh lệch
có ý nghĩa thống kê
•Các hồi quy trong hai thời kỳ là khác nhau
67

67

70

70

5.3 Ứng dụng sử dụng biến giả

5.3 Ứng dụng sử dụng biến giả
Cách 2 Sử dụng biến giả
B1. Lập hàm tiết kiệm tổng quát của cả 2 thời kỳ

Thời kỳ tái thiết: Z = 1

Yˆi  1,75  0,15045X i  1,4839  0,1034 X i
Yˆi  0,2661 0,0475X i

Yi  ˆ1  ˆ2 X i  ˆ3 Z i  ˆ4 X i Z i  ei
Với n = n1 + n2
Z=1
quan sát thuộc thời kỳ tái thiết
Z=0
quan sát thuộc thời kỳ hậu tái thiết
B2. Kiểm định giả thiết H0: 3=0
Nếu chấp nhận H0: loại bỏ Z ra khỏi mô hình

B3. Kiểm định giả thiết H0: 4=0
Nếu chấp nhận H0: loại bỏ ZiXi ra khỏi mô hình

Thời kỳ hậu tái thiết: Z = 0

Yˆi  1,75  0,15045 X i

71

68

68

71

5.3 Ứng dụng sử dụng biến giả

Tiết kiệm
Thời kỳ hậu tái thiết

Yˆi  1,75  0,15045X i
Yˆi  0,2661 0,0475X i
Thời kỳ tái thiết

Thu nhập
-0.27

-1.75

Hình 5.6 Mô hình hồi quy cho 2 thời kỳ

69

69

72

72

12


5.3 Ứng dụng sử dụng biến giả

5.3 Ứng dụng sử dụng biến giả

5.3.3. Hàm tuyến tính từng khúc

Ví dụ 5.6: Doanh thu dưới X* thì tiền hoa hồng
sẽ khác với khi doanh thu trên X*.
Hàm hồi quy có dạng

Yi   1   2 X i   3 ( X i  X * ) Z i  u i
Y
X
X*
Zi
Zi

Tiền hoa hồng
Doanh thu

Giá trị ngưỡng sản lượng
=1 nếu Xi > X*
=0 nếu Xi ≤ X*

CP
SL
CP
SL

256
1000
1839
6000

414
2000
2081
7000

634
3000
2423
8000

778
4000
2734
9000

1003

5000
2914
10000

Ta có kết quả hồi quy như sau:

Yi  145,717  0,279X i  0,095( X i  X * )Zi  ei
t =
R2 =
73

(-0,824)
0,9737

(6,607)
X* = 5500

(1,145)
76

73

76

5.3 Ứng dụng sử dụng biến giả

Y

X


X

*

Hình 5.7 Hàm tuyến tính từng khúc

•Kiểm định giả thiết H0: 3=0
Nếu bác bỏ H0: hàm hồi quy thay đổi cấu trúc
74

74

5.3 Ứng dụng sử dụng biến giả

Ví dụ: Sản lượng dưới X*, thì chi phí hoa hồng
sẽ khác với khi sản lượng trên X*.
Hàm hồi quy sẽ có dạng:

Yi   1   2 X i   3 ( X i  X * ) Z i  u i
Y: Chi phí; X: sản lượng;
X*=5.500 tấn: giá trị ngưỡng sản lượng

1 : X i  X *
Z 1i  
 0 : X i  X *
75

75

13




×