Tải bản đầy đủ (.pdf) (85 trang)

vấn đề so sánh các mẫu dữ liệu thống kê, sự nối khớp giữa dạy học xác suất thống kê với đào tạo cử nhân kinh tế

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.6 MB, 85 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM TP. HỒ CHÍ MINH

Nguyễn Thùy Liên

VẤN ĐỀ SO SÁNH CÁC MẪU DỮ LIỆU
THỐNG KÊ: SỰ NỐI KHỚP GIỮA DẠY
HỌC XÁC SUẤT THỐNG KÊ VỚI ĐÀO
TẠO CỬ NHÂN KINH TẾ

LUẬN VĂN THẠC SĨ GIÁO DỤC HỌC

Thành phố Hồ Chí Minh – 2013


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM TP. HỒ CHÍ MINH

Nguyễn Thùy Liên
VẤN ĐỀ SO SÁNH CÁC MẪU DỮ LIỆU
THỐNG KÊ: SỰ NỐI KHỚP GIỮA DẠY
HỌC XÁC SUẤT THỐNG KÊ VỚI ĐÀO
TẠO CỬ NHÂN KINH TẾ
Chuyên ngành: Lý luận và phương pháp dạy học bộ môn Toán
Mã số: 60 14 01 11

LUẬN VĂN THẠC SĨ GIÁO DỤC HỌC

NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS.TS. LÊ THỊ HOÀI CHÂU


Thành phố Hồ Chí Minh – Năm 2013


LỜI CẢM ƠN
Tôi xin gửi lời cảm ơn chân thành nhất, sâu sắc nhất đến các Thầy, Cô Khoa Toán – Tin, lãnh
đạo và các chuyên viên Phòng Sau đại học Trường Đại học Sư phạm thành phố Hồ Chí Minh đã
giúp tôi hoàn thành chương trình học và luận văn này.
Đặc biệt, tôi xin bày tỏ lòng biết ơn sâu sắc đến PGS. TS Lê Thị Hoài Châu. Luận văn này sẽ
không thể hoàn thành nếu không có sự hướng dẫn tận tình của Cô.
Tôi cũng xin trân trọng cám ơn:
- PGS.TS. Annie Bessot, TS. Alain Birebent đã bỏ công từ Pháp sang Việt Nam để góp ý
hướng nghiên cứu đề tài và giải đáp những thắc mắc trong nghiên cứu Didactic Toán cho chúng
tôi.
- Các thành viên trong lớp Didactic Toán khóa 22 đã giúp đỡ tôi trong suốt khóa học.
- Các thầy cô Khoa Toán – Thống kê, khoa Ngân hàng và các bạn sinh viên K38 trường Đại
học Kinh tế TP.HCM đã giúp đỡ tôi rất nhiều trong vấn đề thực nghiệm của luận văn.
Cuối cùng, tôi muốn gửi lời cám ơn tới bố, mẹ và chồng tôi đã luôn động viên, khích lệ tôi
hoàn thành luận văn này.

Nguyễn Thùy Liên

1


MỤC LỤC
LỜI CẢM ƠN .............................................................................................................. 1
MỤC LỤC .................................................................................................................... 2
DANH MỤC CÁC TỪ VIẾT TẮT ............................................................................ 3
MỞ ĐẦU....................................................................................................................... 4
1. Những ghi nhận ban đầu và câu hỏi xuất phát ............................................................ 4

2. Khung lý thuyết tham chiếu ........................................................................................... 7
3. Phương pháp nghiên cứu ............................................................................................... 9

CHƯƠNG 1: SO SÁNH CÁC MẪU DỮ LIỆU THỐNG KÊ TRONG HAI
GIÁO TRÌNH CHUYÊN NGÀNH .......................................................................... 11
1.1. So sánh các mẫu dữ liệu thống kê ............................................................................ 11
1.2. So sánh các mẫu dữ liệu thống kê trong giáo trình chuyên ngành kinh tế .......... 12
1.2.1. Phân tích giáo trình Phân tích và đầu tư chứng khoán .......................................... 13
1.2.2. Phân tích giáo trình Kinh tế lượng ........................................................................ 21
1.3. Tổng kết chương 1 ..................................................................................................... 29

CHƯƠNG 2: SO SÁNH CÁC MẪU DỮ LIỆU THỐNG KÊ TRONG GIÁO
TRÌNH XS – TK ........................................................................................................ 31
2.1. Phân tích GT3 ............................................................................................................ 34
2.1.1. Kỳ vọng, phương sai, độ lệch chuẩn của ĐLNN .................................................. 34
2.1.2. Giá trị trung bình, phương sai của tổng thể và mẫu .............................................. 41
2.1.3. Hàm hồi qui ........................................................................................................... 43
2.1.4. Các tổ chức toán học liên quan đến so sánh các mẫu dữ liệu thống kê ................ 43
2.2. Tổng kết chương 2 ..................................................................................................... 48

CHƯƠNG 3: NGHIÊN CỨU THỰC NGHIỆM .................................................... 51
3.1. Thực nghiệm ............................................................................................................... 51
3.2. Phân tích tiên nghiệm ................................................................................................ 54
3.3. Phân tích hậu nghiệm ................................................................................................ 59

KẾT LUẬN ................................................................................................................ 64
TÀI LIỆU THAM KHẢO ........................................................................................ 66
PHỤ LỤC ................................................................................................................... 68

2



DANH MỤC CÁC TỪ VIẾT TẮT
Từ viết tắt

Từ đầy đủ

XS – TK

Xác suất – Thống kê

ĐLNN

Đại lượng ngẫu nhiên

GT1

Giáo trình Phân tích và đầu tư chứng khoán

GT2

Giáo trình Kinh tế lượng

GT3

Giáo trình Xác suất - Thống kê

3



MỞ ĐẦU
1. Những ghi nhận ban đầu và câu hỏi xuất phát
Xác suất – Thống kê (XS – TK) là một khoa học nghiên cứu các đại lượng ngẫu nhiên
nên đóng vai trò quan trọng trong hầu hết mọi lĩnh vực của thế giới hiện đại, từ khoa học,
công nghệ, đến kinh tế, chính trị,…Khoa học này trang bị cho chúng ta công cụ để tìm ra
qui luật của những hiện tượng liên quan đến một tập hợp đông đảo các đối tượng mà ta chỉ
có thể tiếp cận một bộ phận của nó (gọi là mẫu thống kê). Chính vì vậy mà XS – TK là môn
học bắt buộc đối với sinh viên của tất cả các trường đại học, cao đẳng và hầu hết các trường
đào tạo nghề trên cả nước. Nhiệm vụ của môn học này là cung cấp cho sinh viên những kiến
thức liên quan đến XS – TK cũng như tạo cơ sở cho sinh viên học các bộ môn chuyên
ngành khác.
Tuy nhiên, trong nghiên cứu của nhóm tác giả Lê Thị Hoài Châu - Đào Hồng Nam:
“Một nghiên cứu về dạy học xác suất trong đào tạo ngành Y”, các tác giả đã chỉ ra sự “thiếu
sót” của chương trình dạy XS – TK trong các trường đào tạo ngành Y. Nội dung chính của
nghiên cứu trên bàn về việc dạy toán trong đào tạo ngành Y với nội dung xoay quanh mô
hình ngưỡng P-K, một mô hình cho phép các bác sĩ quyết định xem bệnh nhân không cần
điều trị, hay cần làm xét nghiệm, hay phải điều trị ngay. Qua phân tích những kiểu nhiệm vụ
liên quan đến mô hình ngưỡng được xem xét trong giáo trình XS – TK sử dụng ở trường
Đại học Y-Dược thành phố Hồ Chí Minh, các tác giả nhận thấy:
“Kỹ thuật toán học cho phép giảm thiểu yếu tố chủ quan trong chẩn bệnh đã không được đưa
vào trong giáo trình. Hệ quả là sinh viên thiếu những kỹ thuật thỏa đáng để chẩn đoán và điều
trị cho bệnh nhân tương lai của họ” (Lê Thị Hoài Châu - Đào Hồng Nam (2013))

Như vậy rõ ràng rằng, việc dạy học XS – TK trong trường đào tạo Y chưa thực sự cung cấp
đủ các công cụ toán cho hoạt động nghề nghiệp của các bác sĩ tương lai.
Chính từ những kết quả nghiên cứu của nhóm tác giả Lê Thị Hoài Châu - Đào Hồng Nam,
chúng tôi đặt ra câu hỏi: Liệu trong các trường đào tạo nghề khác, chẳng hạn như trường
đào tạo kinh tế, thì XS – TK có cung cấp đủ kiến thức cho các môn chuyên ngành sử
dụng hay không?


4


Xuất phát từ câu hỏi này, chúng tôi đã tìm hiểu về việc dạy XS – TK trong các trường đào
tạo kinh tế. Đối với các sinh viên ngành kinh tế, XS – TK thực sự là một công cụ nghiên
cứu rất hữu hiệu, giúp xử lý các thông tin kinh tế xã hội nhằm đưa ra các quyết định và dự
báo đúng đắn, hợp lý. Không những vậy, XS – TK còn cung cấp nền tảng khoa học cho sinh
viên học các môn chuyên ngành. Vì vậy, nếu xem xét giáo trình của nhiều môn học chuyên
ngành kinh tế thì chúng ta sẽ thấy phương pháp và công cụ TK đã được vận dụng đan xen
trong một số nội dung của những môn học này.
Chẳng hạn, trong môn Phân tích và đầu tư chứng khoán, mức độ phân tán của lợi nhuận của
một chứng khoán chính là mức độ rủi ro của chứng khoán đó. Việc xem xét mức độ rủi ro
của các chứng khoán có ý nghĩa rất quan trọng, giúp người đầu tư có thể đưa ra quyết định
có lợi nhất. Chính vì vậy, để học tốt môn học này, sinh viên cần phải nắm bắt được khái
niệm về tham số đo độ phân tán của tổng thể và cách so sánh độ phân tán của hai tổng thể
ngay từ khi học môn XS – TK.
Chúng tôi đã tiến hành khảo sát trên 118 sinh viên năm thứ hai Đại học Kinh tế TP.HCM.
Những sinh viên này đã học xong chương trình XS – TK và chuẩn bị thi phân ngành. Câu
hỏi khảo sát của chúng tôi như sau:
Bài 1: Một công ty sử dụng hai công nghệ khác nhau A và B để sản xuất. Nhằm kiểm
tra xem công nghệ nào cho sản lượng ổn định hơn, người ta ghi lại khối lượng sản
phẩm (tấn) sản xuất ra sau mỗi ngày (khi sử dụng từng công nghệ trên) trong 60
ngày. Số liệu thu được như sau:
Sản lượng (tấn)
khi sử dụng
công nghệ A

35

36


37

38

39

40

41

42

43

Số ngày có
cùng sản lượng

1

2

7

6

8

12


14

9

1

Sản lượng (tấn)
khi sử dụng
công nghệ B

26

27

28

29

30

31

32

33

Số ngày có cùng
sản lượng

1


4

16

13

12

5

7

2

5


Theo bạn, sản xuất theo công nghệ nào cho năng suất ổn định hơn? Giải thích cho
kết luận của bạn.
Thực chất, yêu cầu của bài toán chính là so sánh độ phân tán của hai tổng thể: tổng thể sản
lượng (thu được mỗi ngày) khi sử dụng công nghệ A và tổng thể sản lượng (thu được mỗi
ngày) khi sử dụng công nghệ B. Trong bài toán này chúng tôi đã cố ý chọn số liệu sao cho
giá trị năng suất trung bình của công nghệ A lớn hơn năng suất trung bình công nghệ B và
phương sai của công nghệ A lớn hơn phương sai của công nghệ B nhưng hệ số biến động
của công nghệ A lại nhỏ hơn hệ số biến động của công nghệ B. Như vậy, công nghệ A cho
năng suất ổn định hơn.
Tuy nhiên, kết quả khảo sát được thống kê trong bảng 1 khiến chúng tôi rất bất ngờ.
Chiến


S1a

S1b

S1c

S1d

lược
Số sinh

Không
trả lời

72

30

0

5

11

61,02%

25,42%

0%


4,24%

9,32%

viên
Tỉ lệ

Bảng 1. TK câu trả lời cho bài toán 1
Trong bảng 1, S1a là chiến lược giải sử dụng so sánh hai phương sai, cách giải này đưa ra
đáp án sai: “công nghệ B cho năng suất ổn định hơn”. Trong khi đó, chiến lược giải cho đáp
án đúng là S1c và S1b thì có rất ít hoặc không có sinh viên nào sử dụng. Từ kết quả điều tra
ban đầu này, chúng tôi thu hẹp câu hỏi nghiên cứu lại như sau: Môn SX – TK dạy ở Đại học
Kinh tế TP.HCM đã cung cấp đủ kiến thức cho sinh viên để học có thể giải quyết các vấn
đề của thực tiễn hay của chuyên ngành liên quan đến vấn đề so sánh các tham số của hai
hay nhiều tổng thể chưa?
Từ những băn khoăn và nghi vấn trên, chúng tôi quyết định chọn đề tài: Vấn đề so sánh các
mẫu dữ liệu thống kê: Sự nối khớp giữa dạy học XS – TK với đào tạo cử nhân kinh tế.
Trong khuôn khổ một luận văn thạc sỹ, chúng tôi giới hạn phạm vi nghiên cứu trên hai
phương diện. Về phương diện các chuyên ngành kinh tế chúng tôi chọn môn Kinh tế lượng
và môn Phân tích và đầu tư chứng khoán để nghiên cứu. Về phương diện khoa học XS - TK
6


chúng tôi chọn đối tượng tri thức là “so sánh các mẫu dữ liệu TK”. Ở đây, thuật ngữ “ so
sánh các mẫu dữ liệu TK” được chúng tôi dùng theo nghĩa dự đoán về so sánh các tham số
của các tổng thể dựa trên mẫu dữ liệu TK. Những nghiên cứu của chúng tôi chỉ gói gọn
trong phạm vi của thống kê mô tả mà không đi sâu vào thống kê suy diễn.
Trong nghiên cứu của mình, chúng tôi sẽ tìm câu trả lời cho các câu hỏi sau:
Q1: Trong hai giáo trình chuyên ngành kinh tế, so sánh các mẫu dữ liệu thống kê
nhằm giải quyết những vấn đề gì? Phương pháp giải quyết như thế nào? Khái niệm, lý

thuyết toán nào giải thích cho những phương pháp ấy?
Q2: Giáo trình XS – TK chuẩn bị cho sinh viên ra sao để sinh viên có thể giải
quyết tốt những vấn đề liên quan đến so sánh các mẫu dữ liệu TK mà hai giáo trình
chuyên ngành đã đề cập tới?
Q3: Có sự chênh lệch nào giữa những khái niệm, lý thuyết toán cần thiết cho
chuyên ngành và những nội dung được dạy trong XS-TK không? Nếu có thì sự khôngnối
khớp đó ảnh hưởng đến sinh viên như thế nào?

2. Khung lý thuyết tham chiếu
Để tìm câu trả lời cho những câu hỏi trên, chúng tôi sẽ đặt nghiên cứu của mình trong phạm
vi của lý thuyết didactic toán, cụ thể là thuyết nhân học, khái niệm hợp đồng didactic, khái
niệm qui tắc hành động. Sau đây, chúng tôi sẽ chỉ ra sự lựa chọn của mình là hoàn toàn hợp
lý.
2.1. Thuyết nhân học
2.1.1. Quan hệ thể chế đối với một đối tượng tri thức
Theo Chevallard (1989):
“Một tri thức không tồn tại “lơ lửng” trong một khoảng rỗng: mỗi tri thức đều xuất hiện ở
một thời điểm nhất định, trong một xã hội nhất định, như là được cắm sâu vào một hoặc nhiều
thể chế.”

Chevallard đã dùng thuật ngữ quan hệ thể chế I với tri thức O, ký hiệu R(I,O), để chỉ tập
hợp các mối ràng buộc mà thể chế I có với tri thức O. R(I,O) cho biết O xuất hiện ở đâu,
bằng cách nào, tồn tại ra sao, đóng vai trò gì trong I, ….
7


Trong nghiên cứu của chúng tôi, đối tượng O ở đây là tri thức “so sánh các mẫu dữ liệu
thống kê”, còn thể chế I mà chúng tôi quan tâm là thể chế dạy học các môn Kinh tế lượng,
Phân tích và đầu tư chứng khoán và Xác suất –Thống kê. Việc nghiên cứu R(I,O) sẽ giúp
chúng tôi hiểu rõ hơn những mối ràng buộc mà thể chế mang lại cho đối tượng tri thức O.

Như vậy, nghiên cứu R(I,O) sẽ giúp chúng tôi trả lời câu hỏi Q1 và Q2.
2.1.2. Quan hệ cá nhân đối với một đối tượng tri thức
Một đối tượng là một cái gì đó tồn tại ít nhất đối với một cá nhân. Quan hệ cá nhân của một
cá nhân X với một đối tượng tri thức O, ký hiệu R(X, O), là tập hợp những tác động qua lại
mà X có thể có với O. R(X, O) cho biết X nghĩ gì về O, X hiểu như thế nào O, X có thể thao
tác O ra sao.
Như vậy nghiên cứu R(X,O) sẽ giúp chúng tôi trả lời phần nào câu hỏi Q3. Ở đây O vẫn là
đối tượng tri thức “so sánh các mẫu dữ liệu thống kê” còn X là sinh viên.
2.1.3. Praxéologie
Vấn đề đặt ra là làm thế nào để vạch rõ quan hệ thể chế R(I,O) ?
Hoạt động nghiên cứu, dạy và học là một bộ phận của hoạt động xã hội. Do đó, cũng cần
thiết xây dựng một mô hình cho phép mô tả và nghiên cứu thực tế đó. Xuất phát từ quan
điểm này mà Chevallard (1998) đã đưa vào khái niệm praxéologie. Khái niệm chính là “chìa
khóa” giúp chúng ta làm rõ mối quan hệ I thể chế với tri thức O.
Theo Chavallard, mỗi praxéologie là một bộ gồm 4 thành phần [T, τ , θ , Θ ], trong đó : T là
một kiểu nhiệm vụ; τ là kỹ thuật cho phép giải quyết T; θ là công nghệ giải thích cho kỹ
thuật τ ; Θ là lí thuyết giải thích cho θ .
Nếu T là một kiểu nhiệm vụ toán học, thì praxéologie được gọi mà một tổ chức toán học và
viết là OM. Trong trường hợp này, khối công nghệ - lí thuyết chỉ bao gồm những tri thức
toán học.
Việc xác định các praxéologie gắn với đối tượng O sẽ cho phép chúng tôi: vạch rõ các quan
hệ thể chế R (I,O), đồng thời tìm ra sự chênh lệch nếu có giữa những praxéologie cần dạy và
được dạy. Từ đó, chúng tôi sẽ tìm được câu trả lời cho Q1, Q2 và một phần Q3.
2.2. Khái niệm qui tắc hành động và hợp đồng dạy học
8


Để làm rõ những qui tắc ứng xử của học sinh đối với đối tượng tri thức “so sánh các mẫu dữ
liệu thống kê”, chúng tôi sử dụng khái niệm qui tắc hành động và hợp đồng dạy học:
“Một qui tắc hành động là một mô hình được xây dựng nhằm giải thích và chỉ rõ những kiến

thức mà học sinh đã sử dụng để đưa ra câu trả lời khi thực hiện một nhiệm vụ xác định.”
(Bessot và các tác giả (2009), tr.81)
“Ta nói hợp đồng dạy học là tập hợp những qui tắc phân chia và hạn chế trách nhiệm của mỗi
bên, học sinh và giáo viên, đối với mỗi tri thức toán được giảng dạy.” (Bessot và các tác giả
(2009), tr.81)

Chính vì khái niệm hợp đồng và khái niệm qui tắc hành động cho phép ta “giải mã” các ứng
xử của sinh viên và tìm ra ý nghĩa thực sự của những hoạt động mà họ tiến hành nên chúng
tôi cho rằng cần thiết phải làm rõ các quy tắc hành động hay quy tắc của hợp đồng (nếu có) liên
quan đến so sánh các mẫu dữ liệu thống kê để trả lời cho những câu hỏi Q3 mà chúng tôi đưa
ra.

3. Phương pháp nghiên cứu
Để tìm câu trả lời thỏa đáng cho những câu hỏi đã đặt ra, chúng tôi xác định phương pháp
nghiên cứu như sau:
- Đối với câu hỏi Q1: Chúng tôi sẽ tham khảo hai giáo trình chuyên ngành được sử dụng
trong các trường đào tạo cử nhân kinh tế nhằm tìm hiểu xem những vấn đề nào làm nảy sinh
nhu cầu so sánh các mẫu dữ liệu thống kê. Đồng thời, chúng tôi cũng chỉ ra các praxéologie
có liên quan đến so sánh các mẫu dữ liệu thống kê, nghiên cứu các kĩ thuật giải quyết cũng
như công nghệ và lý thuyết giải thích cho kĩ thuật đó, trong đó chúng tôi chú ý đến các yếu
tố công nghệ thuộc về toán học. Các praxeologie này sẽ giúp chúng tôi hiểu rõ hơn mối
quan hệ thể chế (thể chế dạy học Phân tích và đầu tư chứng khoán và thể chế dạy học Kinh
tế lượng) với đối tượng tri thức so sánh các mẫu dữ liệu thống kê. Toàn bộ phần nghiên cứu
này sẽ được trình bày trong chương 1 của luận văn.
- Tiếp theo, để trả lời cho câu hỏi Q2, chúng tôi sẽ tiến hành phân tích giáo trình XS – TK
để xem xét những đối tượng toán học liên quan đến các tổ chức toán học tìm được ở Q1
được trình bày như thế nào? Xoay quanh các đối tượng đó, có các praxéologie nào?

9



Từ đó chúng tôi sẽ so sánh những gì nghiên cứu được ở Q1 và Q2 để tìm ra câu trả lời cho
Q3.

10


CHƯƠNG 1: SO SÁNH CÁC MẪU DỮ LIỆU THỐNG KÊ TRONG
HAI GIÁO TRÌNH CHUYÊN NGÀNH

Nội dung chính của chương 1 xoay quanh vấn đề “so sánh các mẫu dữ liệu thống kê” được
trình bày trong hai giáo trình chuyên ngành kinh tế. Những phân tích thể chế dạy học hai
môn chuyên ngành này sẽ giúp chúng tôi trả lời câu hỏi Q1:
Q1: Trong hai giáo trình chuyên ngành kinh tế, so sánh các mẫu dữ liệu thống kê
nhằm giải quyết những vấn đề gì? Phương pháp giải quyết như thế nào? Khái niệm, lý
thuyết toán nào giải thích cho những phương pháp ấy?

1.1. So sánh các mẫu dữ liệu thống kê
“So sánh các mẫu dữ liệu thống kê” là thuật ngữ viết tắt chúng tôi dùng để chỉ việc so sánh
tham số của các tổng thể khác nhau dựa trên những mẫu thu được.
Việc so sánh tham số của các tổng thể giúp người ta đưa ra những đánh giá về những tổng
thể đó và từ đó có thể đưa ra được kế hoạch phù hợp cho công việc của họ.
Chẳng hạn một công ty muốn mở thêm chi nhánh kinh doanh. Công ty này đi khảo sát thị
trường tại hai khu vực A và B về mức thu nhập của người dân. Tại khu vực A họ thu được
mẫu A1, tại khu vực B họ thu được mẫu B1. Từ hai mẫu này họ xem xét, đưa ra đánh giá về
thu nhập bình quân của hai khu vực A và B xem bên nào cao hơn, sau đó kiểm định lại kết
quả. Khi đã có được kết luận với độ tin cậy cao, công ty sẽ đưa ra quyết định phù hợp là mở
chi nhánh tại khu vực A hay B.
Trên thực tế, chúng ta có thể thấy việc sử dụng tham số trung bình của các tổng thể để so
sánh được sử dụng rất phổ biến như: so sánh nhiệt độ trung bình, lượng mưa trung bình giữa

các vùng; so sánh lương trung bình của công nhân giữa các công xưởng; so sánh năng suất
cây trồng giữa các vùng,…Tuy nhiên số trung bình không phải là tham số duy nhất của tổng
thể mà ngoài ra còn có những tham số khác như số trung vị, mốt, phương sai, độ lệch chuẩn,
độ lệch tuyệt đối trung bình,…Các tham số này đều có tác dụng giúp người ta đánh giá tốt
hơn về các tổng thể.

11


1.2. So sánh các mẫu dữ liệu thống kê trong giáo trình chuyên ngành kinh tế
Để trả lời cho câu hỏi Q1, chúng tôi sẽ chọn ra một số giáo trình chuyên ngành hoặc cơ sở
ngành có ứng dụng nhiều công cụ và kiến thức của XS –TK để phân tích. Bởi nếu chọn một
giáo trình hoàn toàn không liên quan gì tới XS – TK để phân tích thì kết quả có được sẽ
không có giá trị. Thông qua tìm hiểu các giáo trình của trường Đại học Kinh tế TP.HCM
cũng như tham khảo ý kiến của một số giảng viên, chúng tôi đã tìm ra một số giáo trình thỏa
mãn yêu cầu. Tuy nhiên do thời gian nghiên cứu có hạn, không cho phép phân tích hết
những giáo trình tìm được nên chúng tôi quyết định chọn ra hai giáo trình sau để phân tích:
- Phân tích và đầu tư chứng khoán
- Giáo trình Kinh tế lượng
Chúng tôi xin trích dẫn một số nhận xét về hai bộ môn này:
“Kinh tế lượng cung cấp các phương pháp phân tích về mặt lượng mối quan hệ giữa các chỉ
tiêu kinh tế cùng với sự tác động qua lại giữa chúng dựa trên cơ sở các số liệu thu thập từ
thực tế nhằm củng cố thêm các giả thiết kinh tế từ đó đưa ra các quyết định đúng đắn hơn”

(Hoàng Ngọc Nhậm (2008), tr. 3)
“Dù rằng thị trường chứng khoán là một đối tượng hết sức phức tạp, diễn biến tăng giảm
của nó rất khó dự báo. Nhưng các nhà kinh tế cùng với các nhà toán học đã cố gắng sử
dụng các công cụ của toán học, đặc biệt là các công cụ của Xác suất – Thống kê để mô hình
hóa thị trường chứng khoán. Việc áp dụng các mô hình đó giúp các nhà đầu tư tối đa hóa
các cơ hội đạt lợi nhuận và tối thiểu hóa các nguy cơ rủi ro” (Đặng Hùng Thắng (2007))


Ý kiến trên cho thấy mối liên hệ mật thiết giữa XS-TK với hai môn chuyên ngành kinh tế.
Do đó, chúng tôi mong đợi sẽ tìm thấy những vấn đề làm nảy sinh nhu cầu so sánh các mẫu
dữ liệu thống kê, trong hai giáo trình được sử dụng trong dạy học hai môn chuyên ngành mà
chúng tôi quan tâm. Đồng thời, chúng tôi sẽ chỉ ra những praxéologie có liên quan nhằm
hiểu rõ hơn mối quan hệ thể chế đối với tri thức so sánh các mẫu dữ liệu thống kê: tri thức
so sánh các mẫu dữ liệu thống kê tồn tại như thế nào, có vai trò gì, chịu những ràng buộc
nào của thể chế? Từ đó, chúng tôi sẽ tìm được những “yếu tố” toán thống kê mà thể chế dạy
học hai môn chuyên ngành đưa ra để giải quyết các vấn đề liên quan đến so sánh các mẫu
dữ liệu thống kê. Đó cũng chính là những “yếu tố” toán cần thiết phải được cung cấp trong
môn học XS – TK.
12


Để trả lời câu hỏi Q1 đã đặt ra, chúng tôi sẽ cố gắng tìm câu trả lời cho các câu hỏi sau:
-

So sánh các mẫu dữ liệu thống kê được sử dụng trong những vấn đề nào?

-

Có những praxéologie nào liên quan đến so sánh các mẫu dữ liệu TK? Kĩ thuật
giải quyết chúng là gì? Yếu tố công nghệ và lý thuyết nào giải thích cho kĩ thuật
đó?
1.2.1. Phân tích giáo trình Phân tích và đầu tư chứng khoán

Trong phần này chúng tôi sẽ tham khảo tài liệu sau:
[1] Bùi Kim Yến – Thân Thị Thu Thủy (2009), Phân tích và đầu tư chứng khoán, Nxb
Thống kê.
Đây là giáo trình được sử dụng trong trường đại học kinh tế TP.HCM. Để thuận tiện cho

việc trình bày, chúng tôi sẽ ký hiệu giáo trình này là GT1.
Trong giáo trình này, chúng tôi tập trung vào chương II: Mức sinh lời và rủi ro trong đầu
tư chứng khoán. Trong chương này, các vấn đề chính đều xoay quanh việc sử dụng tham số
của đại lượng ngẫu nhiên (ĐLNN) cũng như so sánh các tham số này để tìm câu trả lời cho
những câu hỏi có liên quan đến đầu tư chứng khoán.
Đối với một thị trường đầu tư phức tạp và đầy biến động như thị trường chứng khoán, các
nhà phân tích phải nắm được những kiến thức cơ bản về lợi nhuận và rủi ro. Chương này
cung cấp cho sinh viên các vấn đề xoay quanh mức sinh lời và rủi ro, đưa ra cách tính mức
sinh lời, cách tính và đánh giá độ rủi ro của dự án.
Trong mỗi dự án đầu tư chứng khoán, người ta thường phải dự đoán trước lợi nhuận, tức là
ước lượng xem đầu tư vào dự án đó sẽ mang lại lợi nhuận là bao nhiêu phần trăm trên 1
đồng vốn đầu tư. Khi đó, nhà phân tích sẽ phải tìm ra các mức sinh
lời 1 của mỗi loại chứng khoán - bao gồm lợi nhuận từ cổ tức và chênh lệch giữa giá bán, giá
F
0

mua chứng khoán, cũng như xác suất của mỗi mức sinh lời để từ đó tính ra mức sinh lời kỳ
vọng. Chính mức sinh lời kỳ vọng là lợi nhuận mà người ta dự tính sẽ thu được:

1

Mức sinh lời: bao gồm lợi nhuận từ cổ tức và chênh lệch giữa giá bán, giá mua chứng khoán. Còn tỷ lệ lợi tức năm là

cách xác định mức sinh lời theo tỷ lệ phần trăm. Nó cho biết lợi nhuận thu được trên mỗi đồng đầu tư.

13


“Các dự án đầu tư khác nhau sẽ có mức sinh lời kỳ vọng khác nhau. Chúng khác nhau vì hiệu
quả kinh tế của từng dự án cụ thể, cũng như môi trường đầu tư. Trong tương lai không thể

biết chắc được nền kinh tế sẽ như thế nào, nên các nhà phân tích sẽ tìm ra một xác suất để xảy
ra một tình trạng kinh tế nào đó.
Mức sinh lời kỳ vọng dựa trên xác suất của từng tình trạng kinh doanh.

k = ∑ Pk
i i
Trong đó: ki: mức sinh lời; pi: xác suất xảy ra” (GT1, tr.58)

Trong khi đó, rủi ro:
“là khả năng mức sinh lời thực tế nhận được trong tương lai có thể khác với dự tính ban đầu.
Độ dao động của lợi suất đầu tư 2 càng cao thì rủi ro càng cao” (GT1, tr.49)
1F

Mức độ rủi ro của dự án được đo bằng phương sai, độ lệch chuẩn hoặc hệ số biến động:
“Để đo lường rủi ro trong mức sinh lời của một loại chứng khoán, đó là tính toán mức dao
động trong mức sinh lời bằng cách sử dụng thước đo phương sai (variance) và độ lệch chuẩn
(standard deviation)” (GT1, tr.60)
“Một cách đo lường mức độ rủi ro của các phương án khác nữa, là dùng hệ số biến động.
Hệ số biến động được tính bằng cách lấy độ lệch tiêu chuẩn chia cho lãi suất mong đợi của
phương án đầu tư.
CV =

δ
k

” (GT1, tr.63)

Các tác giả giải thích việc sử dụng hệ số biến động để đo lường rủi ro như sau:

r=


( P1 − P0 ) + D1
P0

([1], tr. 45)

Trong đó r là mức sinh lời tính theo %, P0 là giá cổ phiểu đầu năm, P1 là giá cổ phiểu cuối năm, D1 là giá cổ tức trả
trong năm.
2

Lợi suất đầu tư: Là phần trăm (%) chênh lệch giữa thu nhập từ chứng khoán có được sau một khoảng thời gian

(thường là một năm) và khoản vốn đầu tư ban đầu. Lợi suất của chứng khoán bắt nguồn từ hai nguồn thu nhập:
-

Lãi định kỳ (cổ tức, trái tức)

-

Lãi vốn (chênh lệch giá bán và giá mua)

14


“Hệ số biến động chỉ mức độ rủi ro trên một đơn vị của lợi tức, nó cung cấp sự so sánh
chính xác hơn trong trường hợp lãi suất mong đợi của hai phương án không như nhau.”

(GT1, tr.63)
Phương sai, độ lệch chuẩn và hệ số biến động đều là những tham số mô tả mức độ phân tán
của các giá trị của một đại lượng ngẫu nhiên (tổng thể) quanh kỳ vọng (giá trị trung bình).

Như vậy phương sai, độ lệch chuẩn hay hệ số biến động của các phương án đầu tư chứng
khoán phản ánh mức độ phân tán của những giá trị lợi nhuận quanh lợi nhuận kỳ vọng. Mức
độ phân tán này cho chúng ta biết mức độ chênh lệch có thể có giữa lợi nhuận thực tế với lợi
nhuận mong đợi (lợi nhuận kỳ vọng). Cũng vì vậy mà những tham số này được sử dụng để
đo mức độ rủi ro của các phương án đầu tư chứng khoán.
Để sinh viên hiểu rõ hơn về lợi nhuận và rủi ro, tác giả lấy hai ví dụ minh họa. Đặc biệt, hai
ví dụ này có liên quan đến việc đánh giá rủi ro của các phương án đầu tư chứng khoán. Việc
đánh giá rủi ro thực sự rất cần thiết đối với mỗi nhà đầu tư. Vì vậy, tác giả rất chú trọng tới
vấn đề này trong giáo trình.
Với ví dụ trang 58 của GT1, chúng tôi thấy xuất hiện một vấn đề liên quan đến so sánh các
tham số của hai tổng thể:
“Ví dụ: Công ty Bưu Chính Viễn Thông hiện đang sử dụng mạng lưới “điện thoại tiêu
chuẩn”. Công ty đang nghiên cứu một đề án mạng lưới “điện thoại kiểu mới”. Các chuyên
viên tiếp thị của công ty cho rằng việc sử dụng mạng lưới mới sẽ mang lại lợi nhuận cao hơn
trong các thời kỳ cao điểm và trung bình, nhưng trong thời kỳ khó khăn, khách hàng sẽ tiêu
thụ ít hơn và mạng lưới mới dự đoán sẽ không mang lại lợi nhuận. Trước khi quyết định đầu
tư, các nhà nghiên cứu thị trường của công ty cần xác định rủi ro và lợi nhuận của hai phương
án trên.

Phương án kiểu mới
Tình trạng kinh tế

Tỷ lệ xảy ra tình trạng Suất lợi nhuận ở mỗi tình
kinh tế
trạng kinh tế

15


Phát đạt


0,3

100%

Bình thường

0,4

15%

Khó khăn

0,3

-70%

-------1,0

Phương án tiêu chuẩn
Tình trạng kinh tế

Tỷ lệ xảy ra tình trạng Suất lợi nhuận ở mỗi tình
trạng kinh tế
kinh tế

Phát đạt

0,3


20%

Bình thường

0,4

15%

Khó khăn

0,3

10%

-------1,0
(GT1, tr.59)

Trước khi đưa ra lời giải thì các tác giả nhắc lại công thức tính lợi nhuận kỳ vọng, hay lãi
suất mong đợi (lãi suất trung bình):
“Pi là khả năng xảy ra (xác suất) của các tình trạn kinh tế
ki là suất lợi nhuận dự đoán cho từng thời kỳ kinh tế.
Thì k là tỷ lệ lãi suất mong đợi (trung bình).
n

k = ∑ Pk
i i ” (GT1, tr.60)
i =1

Sau đó, lợi nhuận mong đợi của hai phương án được tính như sau:
“Đối với phương án mạng lưới điện thoại mới:


k = Pk
1 1 + P2 k 2 + P3 k3
= 0,3(100%) + 0, 4(15%) + 0,3(−70%)
= 15%
Đối với phương án mạng lưới điện thoại tiêu chuẩn:

16


k = 0.3(20%) + 0.4(15%) + 0.3(10%)
= 15%” (GT1, tr.60)

Chúng ta có thể thấy k của hai phương án tính ra đều bằng nhau nên lợi nhuận mong đợi
của hai phương án là như nhau.
Sau khi tính lợi nhuận kỳ vọng của hai phương án, tác giả nhắc lại cách tính phương sai, độ
lệch chuẩn cho sinh viên:
“- Tính tỷ suất lãi mong đợi ( k ) […]
- Tính độ lệch giữa lãi suất của từng trường hợp và tỷ suất lãi mong đợi.
- Độ lệch i = ki – k
- Bình phương độ lệch I và nhân với từng xác suất xảy ra từng tình trạng kinh tế. Tính tổng số
của chúng. Tổng này là phương sai của dự án (variance) bằng δ 2 :
n

(

)

Phương sai: δ 2 = ∑ k i − k × Pi
i =1


2

- Tìm độ lệch tiêu chuẩn bằng căn bậc hai của δ 2 :
Độ lệch tiêu chuẩn: δ =

∑ (k
n

i =1

)

2

i

− k × Pi ” (GT1, tr.61)

Với các bước tính độ lệch chuẩn nêu ra ở trên, độ lệch chuẩn của từng dự án được tính dưới
dạng bảng như sau:
“Mạng lưới điện thoại mới:
ki – k

(ki – k )

(ki – k )2Pi

100 – 15


(85)

(7725)(0,3)=2167,5

15 – 15

0

0.(0,4) = 0

-70 – 15

( - 85)

(7725)(0,3)=2167,5
Phương
=4435,0

Độ lệch tiêu chuẩn: δ = 65,84%

sai

**Mạng lưới điện thoại tiêu chuẩn:
ki – k

(ki – k)

17

(ki – k)2Pi


δ2


20 – 15

(5)

(25)(0,3) = 7,5

15 – 15

0

0.(0,4) = 0

10 – 15

( - 5)

(25)(0,3)= 7,5

Độ lệch tiêu chuẩn: δ = 3,87% ” (GT1, tr.62)

Phương sai δ 2 =15,0

Từ những kết quả tính toán lợi nhuận kỳ vọng và độ lệch chuẩn, tác giả kết luận:
“Phương án mạng lưới tiêu chuẩn với độ lệch tiêu chuẩn 3,87% nhỏ hơn nhiều so với độ lệch
tiêu chuẩn của phương án đầu tư mới 65,84%. Điều đó dẫn đến khả năng rủi ro của phương án
mạng lưới tiêu chuẩn thấp hơn so với phương án mới, và có thể nói phương án mạng lưới tiêu

chuẩn là rất ít có rủi ro” (GT1, tr.62)

Nhận xét về ví dụ trên:
- Lãi suất mong đợi được tính theo lợi nhuận kỳ vọng. Mức độ rủi ro được tính theo độ
lệch chuẩn.
- Với lãi suất mong đợi bằng nhau, thì để xem phương án nào rủi ro hơn, tác giả so sánh
các độ lệch chuẩn với nhau. Phương án nào có độ lệch chuẩn càng thấp thì độ rủi ro càng
ít và ngược lại. Thực chất bài toán này chính là bài toán so sánh mức độ phân tán của hai
ĐLNN. Khi hai ĐLNN có kỳ vọng bằng nhau thì ĐLNN nào có phương sai (độ lệch
chuẩn) lớn hơn sẽ có độ phân tán các giá trị quanh kỳ vọng lớn hơn.
Trong ví dụ trên, hai phương án đầu tư có lợi nhuận kỳ vọng bằng nhau, tác giả so sánh hai
độ lệch chuẩn để kết luận về độ rủi ro của hai phương án. Vậy đối với hai phương án mà lợi
nhuận kỳ vọng khác nhau thì sao? Trong trường hợp này thì việc so sánh hai độ lệch chuẩn
không còn phù hợp nữa, người ta phải sử dụng đến hệ số biến động CV:
“Sau đây chúng ta xét đến 2 dự án đầu tư khác A và B, cả 2 có lãi suất mong đợi khác nhau và
độ lệch tiêu chuẩn cũng khác nhau.
Phương án A

Phương án B

Tỷ suất lãi mong đợi

45%

20%

Độ lệch tiêu chuẩn

15%


10%

Nếu nhìn vào độ lệch tiêu chuẩn δ B < δ A và ta chọn phương án B là hoàn toàn không
chính xác vì tỷ suất lãi mong đợi của phương án A lớn hơn phương án B.
Hợp lý hơn ta tính hệ số biến động (CV)

18


15%
= 0,33
45%
CVA=

10%
= 0,50
CVB= 20%
Tính trên 1% lãi suất mong đợi, hệ số biến động của phương án B lớn hơn. Điều đó có nghĩa
mặc dù phương án A có độ lệch chuẩn rộng hơn nhưng thực sự phương án B lại mang nhiều
tính rủi ro hơn” (GT1, tr.64)

Đối với các dự án có mức sinh lời khác nhau thì người ta phải sử dụng tới hệ số biến động
để đo mức độ rủi ro trên 1 % lãi suất mong đợi. Ví dụ trên thực chất là một bài tập so sánh
độ phân tán của hai đại lượng ngẫu nhiên (hay hai tổng thể) khi giá trị kỳ vọng (trung bình)
khác nhau. Trong trường hợp này, so sánh trực tiếp bằng phương sai hay độ lệch chuẩn sẽ
không mang lại cho chúng ta kết quả chính xác nữa. Chúng ta có thể thấy tác giả đã nhấn
mạnh:
“Nếu nhìn vào độ lệch tiêu chuẩn δ B < δ A và ta chọn phương án B là hoàn toàn không chính
xác vì tỷ suất lãi mong đợi của phương án A lớn hơn phương án B” (GT1, tr.64)


Như vậy, đối với trường hợp này, để xem xét mức độ chênh lệch các giá trị của mỗi ĐLNN
quanh kỳ vọng ta phải sử dụng tới hệ số biến động CV. Nếu so sánh bằng hai phương sai sẽ
dẫn tới kết quả không chính xác.
Thông qua hai ví dụ trên, tác giả tổng kết lại phương pháp giúp sinh viên so sánh rủi ro của
các phương án đầu tư như sau:
“Tóm tắt:
Để đo lường mức độ rủi ro của các phương án đầu tư:
-

So sánh hai phương án có cùng tỷ suất lãi mong đợi, phương án nào có độ lệch tiêu chuẩn ( δ )

-

So sánh hai phương án có tỷ suất lãi mong đợi khác nhau, tính hai hệ số biến động. Phương án

lớn hơn, phương án đó mang tính rủi ro cao hơn.
nào có hệ số biến động cao hơn, phương án đó nhiều rủi ro hơn.” (GT1, tr.64)

Qua hai ví dụ và phần tóm tắt của giáo trình, một tổ chức toán học liên quan đến so sánh các
mẫu dữ liệu thống kê đã xuất hiện:

19


Kiểu nhiệm vụ TSSDLC &CV 3: so sánh độ phân tán của hai đại lượng ngẫu nhiên (hay
2F

hai tổng thể).
Kĩ thuật τ SSDLC&CV để giải quyết TSSDLC &CV
n


• B1: Tính mức sinh lời kỳ vọng của mỗi dự án: k = ∑ Pk
i i trong đó:
i =1

Pi là khả năng xảy ra (xác suất) của các tình trạng kinh tế
ki là suất lợi nhuận dự đoán cho từng thời kỳ kinh tế.
• B2: Tính độ lệch chuẩn của mỗi dự án δ =

∑ (k
n

i =1

)

2

i

− k × Pi

• B3: Xét các trường hợp:
* Nếu mức sinh lời kỳ vọng của các dự án bằng nhau, so sánh độ lệch chuẩn các dự
án, độ lệch chuẩn của dự án càng cao thì rủi ro càng cao.
* Nếu mức sinh lời kỳ vọng của các dự án khác nhau:
δ

- Tính hệ số biến động của mỗi dự án: CV= k
- So sánh các hệ số biến động của các dự án, hệ số biến động càng cao thì rủi ro

càng cao.
Vậy công nghệ θ SSDLC&CV :
-

-

Công thức tính kỳ vọng và độ lệch chuẩn của ĐLNN X (với X là lợi suất hay lãi
suất).
Ý nghĩa của độ lệch chuẩn.
Ý nghĩa của hệ số biến động.

Lý thuyết Θ SSDLC&CV
-

3

Định nghĩa độ lệch chuẩn.
Định nghĩa hệ số biến động.

Để giải quyết kiểu nhiệm vụ này người ta so sánh hai độ lệch chuẩn (khi lợi nhuận kỳ vọng của các dự án bằng nhau)

hoặc so sánh hệ số biến động CV (khi lợi nhuận kỳ vọng của các dự án khác nhau). Do đó chúng tôi kí hiệu cho kiểu
nhiệm vụ này là TSSDLC&CV

20


1.2.2. Phân tích giáo trình Kinh tế lượng
Trong phần phân tích này chúng tôi sử dụng tài liệu sau: Hoàng Ngọc Nhậm (chủ biên)
(2008), Giáo trình kinh tế lượng, Nxb Lao động - Xã hội. Trong phần tiếp theo chúng tôi sẽ

dung ký hiệu GT2 để chỉ tài liệu này.
Kinh tế lượng là một bộ môn cung cấp cho sinh viên phương pháp phân tích về mặt lượng
mối quan hệ giữa các chỉ tiêu kinh tế dựa trên những số liệu thu thập được. Ngoài việc giới
thiệu các mô hình hồi qui cơ bản như hồi qui với hai biến, hồi qui bội, GT2 còn đưa vào một
số môt hình hồi qui khác bao gồm hồi qui với biến giả, đa cộng tuyến,… Trong những mô
hình hồi qui đó, chúng tôi rất chú ý đến mô hình hồi qui với biến giả bởi vì mô hình này cho
phép người ta xem xét mối liên hệ giữa các biến định tính với các biến định lượng. Các biến
định tính thường nhận các giá trị (phạm trù) là có tính chất nào đó hay không có, hoặc các
mức độ khác nhau của một tiêu thức nào đó, chẳng hạn như biến định tính giới tính có 2
phạm trù là nam và nữ,…Trong khi đó, các mô hình hồi qui 2 biến cơ bản hay các mô hình
hồi qui bội chỉ nghiên cứu trên các biến định lượng. Chính vì vậy, người ta phải dùng tới mô
hình hồi qui với biến giả. Mô hình này được xây dựng bằng cách “lượng” hóa các biến định
tính. Chẳng hạn, nếu biến định tính là giới tính nhận hai giá trị (phạm trù) là nam và nữ thì
người ta sẽ thay biến này bằng một biến rời rạc nhận hai giá trị là 0 và 1 với 0 là giới tính
nam, 1 là giới tính nữ. Khi đó, biến định tính đã được thay thế bằng biến định lượng, từ đó
có thể xây dựng được các mô hình giúp chúng ta xem xét mối liên hệ giữa biến định tính với
các biến định lượng. Điều đặc biệt nữa là, mô hình hồi qui với biến giả có thể được ứng
dụng để giải quyết các bài toán liên quan đến so sánh các tham số của hai tổng thể.
Chúng ta hãy quan sát ví dụ trang 109:
“Giả sử một công ty sử dụng 2 công nghệ sản xuất (kí hiệu là công nghệ A và công nghệ B).
Năng suất của mỗi công nghệ là đại lượng ngẫu nhiên phân phối theo qui luật chuẩn có
phương sai bằng nhau nhưng kì vọng toán học khác nhau. Để nghiên cứu về năng suất của
công ty này chúng ta có thể sử dụng mô hình hồi qui:

Yi =
β1 + β 2 Di + U i

(5.1)

Trong đó : Y là năng suất; D là biến giả, D nhận một trong hai giá trị:0 hoặc 1:


Di = 1 nếu năng suất là của công nghệ A

21


Di = 0 nếu năng suất là của công nghệ B
Mô hình (5.1) giống như mô hình hồi qui 2 biến mà chúng ta đã nghiên cứu ở phần trước, chỉ
khác là biến số lượng X được thay bằng biến giả D”
(GT2, tr.109)

GT2 nhấn mạnh rằng:
“Dùng mô hình này chúng ta có thể biết được năng suất trung bình của công nghệ A có khác
với năng suất trung bình của công nghệ B hay không” (GT2, tr.110).

Điều này được giải thích như sau:
Nếu sử dụng công nghệ sản xuất B thì E(Yi/Di = 0)= β1
Nếu sử dụng công nghệ sản xuất A thì E(Yi/Di =1)= β1 + β 2
Do đó, ý nghĩa của hệ số β 2 trong mô hình:
“ β 2 phản ánh mức chênh lệch về năng suất trung bình giữa công nghệ B và công nghệ A”
(GT2, tr.110)

Cách tính các hệ số của mô hình này cũng giống như đối với mô hình hồi qui hai biến mà
tác giả đã trình bày ở phần trước:
“Mô hình (5.1) giống như mô hình hồi qui hai biến mà chúng ta đã nghiên cứu ở phần trước,
chỉ khác là biến số lượng X được thay bằng biến giả D” (GT2, tr.110)

Nhờ ý nghĩa của hệ số β 2 mà mô hình hồi qui với biến giả có thể sử dụng để so sánh năng
suất trung bình của hai công nghệ A và B.
Tương tự như vậy, mô hình hồi qui với biến giả cũng được sử dụng để xem xét sự khác

nhau giữa năng suất trung bình của 3 công nghệ A, B, C
“Trong trường hợp này ta sử dụng 2 biến giả D1 và D2 và mô hình hồi qui sẽ là:
Yi = β1 + β 2 D1i + β 3 D2i + U i

(5.2)

Trong đó:

D1i = 1 nếu năng suất của công nghệ A
D1i = 0 nếu năng suất của công nghệ khác
D2i = 1 nếu năng suất của công nghệ B
22


D2i = 0 nếu năng suất của công nghệ khác
Khi D1i =1 và D2i = 0 thì (5.2) biểu thị năng suất của công nghệ A
Khi

D1i = 0 và D2i = 1 thì (5.2) biểu thị năng suất của công nghệ B

Khi D1i = 0 và D2i = 0 thì (5.2) biểu thị năng suất của công nghệ C”
(GT2, tr.110)

GT2 cũng giải thích tại sao mô hình trên có thể xem xét sự khác biệt hay chênh lệch giữa
năng suất trung bình của 3 công nghệ:
Nếu sử dụng công nghệ sản xuất A thì năng suất trung bình
E(Yi/ D1i =1, D2i = 0)= β1 + β 2
Nếu sử dụng công nghệ sản xuất B thì năng suất trung bình
E(Yi/ D1i = 0, D2i = 1)= β1 + β 3
Nếu sử dụng công nghệ sản xuất C thì năng suất trung bình

E(Yi/ D1i = 0, D2i = 0)= β1
Hơn nữa, tác giả nhấn mạnh ý nghĩa của các hệ số trong mô hình hồi qui như sau:
“ β 2 biểu thị phần chênh lệch của năng suất trung bình giữa công nghệ C và công nghệ A

β3 biểu thị phần chênh lệch của năng suất trung bình giữa công nghệ C và công nghệ B”
(GT2, tr.110-111)

Như vậy, mô hình hồi qui với một biến định tính như trên thể hiện mối liên hệ giữa biến phụ
thuộc Y (là một biến định lượng) và một biến định tính (có nhiều phạm trù). Dựa vào các hệ
số của mô hình hồi quy ta có thể so sánh được các giá trị trung bình của biến định lượng
ứng với từng giá trị của biến định tính.
Ngoài ra, các mô hình hồi qui với 1 biến định lượng và 1 biến định tính, hồi qui với 1 biến
định lượng và hai biến định tính cũng được giáo trình đưa vào, áp dụng trong trường hợp
biến phụ thuộc Y chịu ảnh hưởng bởi cả biến định lượng và biến định tính. Khi đó, mô hình
hồi qui cũng cho biết giá trị trung bình của Y ứng với mỗi phạm trù của biến định tính khác
nhau như thế nào.

23


×