Tải bản đầy đủ (.pdf) (72 trang)

Đánh giá chất lượng học tập của sinh viên trường đại học kỹ thuật y tế hải dương

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.22 MB, 72 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
- - - - - - O0O - - - - - -

Phạm Thị Thùy Như

ĐÁNH GIÁ CHẤT LƯỢNG
HỌC TẬP CỦA SINH VIÊN TRƯỜNG
ĐẠI HỌC KỸ THUẬT - Y TẾ HẢI DƯƠNG

Chuyên ngành: Xác suất và Thống kế toán học
Mã số: 60 46 15

LUẬN VĂN THẠC SĨ TOÁN HỌC

Người hướng dẫn khoa học:

PGS.TS. Hồ Đăng Phúc

Hà Nội - 2012


Mục lục

Lời nói đầu

3

1 Mơ hình tuyến tính nhiều mức

6



1.1

Dữ liệu nhiều mức . . . . . . . . . . . . . . . . . . . . .

6

1.2

Sự cần thiết sử dụng mơ hình phân tích nhiều mức . . .

7

1.3

Mức độ chính xác của các kết luận thống kê . . . . . . .

8

1.4

Ưu thế của mơ hình nhiều mức . . . . . . . . . . . . . .

8

1.5

Mơ hình tuyến tính nhiều mức và các ước lượng . . . . .

9


1.6

Mơ hình 2 mức với hệ số ngẫu nhiên . . . . . . . . . . .

11

1.7

Hệ số tương quan nội tại . . . . . . . . . . . . . . . . . .

14

1.8

Mơ hình 2 mức tổng quát bao gồm các hệ số ngẫu nhiên

17

1.9

Ước lượng cho mơ hình nhiều mức . . . . . . . . . . . . .

18

1.10 Số dư trong mơ hình 2 mức . . . . . . . . . . . . . . . .

21

1.11 Ước lượng số dư trong mơ hình nhiều mức . . . . . . . .


23

1.12 Kiểm định giả thuyết và khoảng tin cậy . . . . . . . . . .

24

1.12.1 Tham số cố định . . . . . . . . . . . . . . . . . .

25

1.12.2 Tham số ngẫu nhiên . . . . . . . . . . . . . . . .

28

1


1.13 Cấu trúc hiệp phương sai phức hợp . . . . . . . . . . . .

29

1.14 Phương sai của nhóm con định nghĩa ở mức 1 . . . . . .

31

1.15 Phương sai như một hàm của giá trị dự đoán . . . . . . .

35


2 Tác động của các nhân tố đến kết quả học tập của sinh
viên

36

2.1

Mô tả số liệu . . . . . . . . . . . . . . . . . . . . . . . .

36

2.2

Các yếu tố ảnh hưởng đến điểm tổng kết học kỳ 1 . . . .

42

2.3

Các yếu tố ảnh hưởng đến điểm tổng kết học kỳ 2 . . . .

46

2.4

Các yếu tố ảnh hưởng đến điểm tổng kết học kỳ 3 . . . .

50

2.5


Các yếu tố ảnh hưởng đến điểm tổng kết học kỳ 4 . . . .

53

2.6

Các yếu tố ảnh hưởng đến điểm tổng kết học kỳ 5 . . . .

56

2.7

Các yếu tố ảnh hưởng đến điểm tổng kết học kỳ 6 . . . .

60

2.8

Các yếu tố ảnh hưởng đến điểm tổng kết tồn khóa . . .

64

Kết luận

68

Tài liệu tham khảo

71


2


Lời nói đầu
"Phát triển giáo dục và đào tạo là một trong những động lực quan
trọng thúc đẩy sự nghiệp cơng nghiệp hóa, hiện đại hóa, là điều kiện để
phát huy nguồn lực con người – yếu tố cơ bản để phát triển xã hội, tăng
trưởng kinh tế nhanh và bền vững" . Trong đó, nhiệm vụ trọng yếu, nền
tảng của chương trình giáo dục Đại học là xây dựng và đào tạo cho đất
nước một đội ngũ trí thức có nhân cách, có đạo đức, có khả năng làm
chủ về chuyên môn nghiệp vụ, với thể chất mạnh khỏe để đáp ứng tốt
yêu cầu của sự nghiệp công nghiệp hóa, hiện đại hóa đất nước.
Trong những năm qua, giáo dục và đào tạo đã có những đóng góp
nhất định trong giải quyết các vấn đề kinh tế; khai thác nội lực và phát
huy được tiềm năng, lợi thế của đất nước, tạo được vị thế trên trường
quốc tế. Tuy nhiên, thực tế công tác giáo dục của nước ta còn nhiều tồn
tại, điều kiện giáo dục còn ở trong tình trạng lạc hậu, trì trệ, chất lượng
thấp. Có khơng ít trường đại học, cao đẳng sở hữu một đội ngũ giảng
viên chất lượng khơng cao, khơng có khả năng nghiên cứu dẫn đến một
thực trạng sinh viên được đào tạo ra khơng thích nghi được thực tế của
xã hội hiện tại. Để tận dụng được các cơ hội phát triển trong giáo dục và
đào tạo, hạn chế những mặt tồn tại, chúng ta cần phải nhận biết những
đặc điểm riêng của hệ thống giáo dục đào tạo, xác định được những quy
3


luật tự nhiên của hệ thống. Từ đó có thể vận hành hệ thống phù hợp
với những quy luật đó, tránh đưa ra những quyết sách mang nặng tính
chủ quan duy ý chí. Việc phát hiện những quy luật đó chỉ có thể thực

hiện được thơng qua những nghiên cứu khoa học.
Sử dụng phương pháp thống kê nhiều mức dùng phần mềm Stata để
phân tích làm rõ một số yếu tố ảnh hưởng đến kết quả học tập của sinh
viên Trường Đại học Kỹ thuật Y tế Hải Dương, từ đó đưa ra một số
định hướng trong cơng tác đào tạo là mục tiêu của luận văn “Đánh giá
chất lượng học tập của sinh viên trường Đại học Kỹ thuật Y
tế Hải Dương”. Sau lời mở đầu, luận văn gồm có hai chương và danh
mục tài liệu tham khảo.
Chương I trình bày về phương pháp phân tích thống kê dùng trong
nghiên cứu là phương pháp phân tích nhiều mức. Trong đó trình bày
cụ thể về mơ hình hồi quy hai mức cơ bản và mơ hình nhiều mức tổng
qt.
Chương II đưa ra các kết quả phân tích ảnh hưởng của các yếu tố
giới tính sinh viên, điểm tuyển sinh đầu vào, nghề nghiệp của bố mẹ,
quê quán của sinh viên đến kết quả học tập của sinh viên. Tại đây các
phương pháp thống kê được áp dụng một cách phù hợp để đưa ra những
kết luận có tính thuyết phục, đảm bảo tính khoa học.
Luận văn này được hồn thành tại Khoa Toán – Cơ – Tin thuộc
Trường ĐH Khoa học Tự nhiên – ĐHQG Hà Nội. Trước tiên tôi xin
bày tỏ lòng biết ơn sâu sắc nhất đến PGS.TS Hồ Đăng Phúc, người đã
truyền cho tôi nguồn cảm hứng nghiên cứu khoa học, hướng dẫn, chỉ
bảo tôi hết sức tận tình trong suốt q trình nghiên cứu. Tơi xin trân
4


trọng cảm ơn các thầy cơ giáo trong khoa Tốn – Cơ – Tin, đặc biệt các
thầy trong tổ Bộ môn Xác suất và Thống kê đã cung cấp cho tôi các
kiên thức chuyên ngành cần thiết để thực hiện đề tài. Tôi cũng xin chân
thành cảm ơn các thày cơ phịng Sau đại học đã nhiệt tình giúp đỡ tôi
trong suốt thời gian học tập. Tôi xin gửi lời cảm ơn đến các anh chị em

lớp cao học Lý thuyết Xác suất và thống kê tốn học khóa 2009 – 2011,
cùng các bạn đồng nghiệp và gia đình đã nhiệt tình đóng góp ý kiến,
giúp đỡ tơi trong suốt q trình học tập và hồn thành luận văn.
Đặc biệt, tôi xin gửi lời cảm ơn sâu sắc tới Ban Giám hiệu, Phịng đào
tạo, Phịng Cơng tác học sinh sinh viên của trường Đại học Kỹ thuật Y
tế Hải Dương đã nhiệt tình cung cấp những dữ liệu chính xác quý báu
giúp tôi thực hiện luận văn này. Tuy đã có nhiều cố gắng trong q trình
thực hiện, song chắc chắn luận văn của tôi không thể tránh khỏi những
thiếu xót. Tơi rất mong nhận được sự tham gia đóng góp ý kiến của q
thầy cơ, các nhà nghiên cứu Xác suất Thống kê, nghiên cứu Giáo dục
và các độc giả quan tâm đến luận văn này.
Tôi xin chân thành cảm ơn!

Hà Nội, ngày 12 tháng 1 năm 2012
Học viên: Phạm Thị Thùy Như

5


Chương 1
Mơ hình tuyến tính nhiều mức
1.1

Dữ liệu nhiều mức

Khi thu thập số liệu trong các ngành khoa học xã hội, chúng ta thường
gặp cấu trúc số liệu có thứ bậc hay cấu trúc số liệu lồng nhóm. Nói cách
khác số liệu được thu thập ở các mức khác nhau của đơn vị quan sát.
Ví dụ khi xem xét đặc điểm của trẻ em, số liệu về chiều cao và trí thơng
minh được thu thập ở từng cá nhân trẻ em, nhưng kết luận có thể đưa

ra cho các gia đình và khu vực. Người ta nhận xét rằng những đứa trẻ
được sinh ra trong cùng một gia đình có xu hướng giống nhau về ngoại
hình và tính cách hơn những đứa được chọn ngẫu nhiên từ quần thể nói
chung.
Chúng ta đề cập đến sự phân cấp, trong đó các đơn vị được nhóm lại
ở các mức khác nhau. Lúc đó, trẻ em là đơn vị mức 1 được xếp trong
phạm vi gia đình, gia đình là đơn vị mức 2 được xếp lồng nhóm trong
phạm vi khu dân cư (đơn vị mức 3) và khu dân cư được lồng nhóm trong
phạm vi các phường (đơn vị mức 4).

6


1.2

Sự cần thiết sử dụng mơ hình phân tích nhiều
mức

Một nghiên cứu về khả năng “học đọc” của trẻ em trường tiểu học
được thực hiện ở nước Anh năm 1970 chỉ ra rằng nhóm học sinh “chuộng
hình thức” có khả năng đọc tốt hơn. Dữ liệu được phân tích sử dụng các
kỹ thuật hồi quy truyền thống nhận các cá nhân là đơn vị phân tích,
bỏ qua ảnh hưởng của sự ghép nhóm theo các mức giáo viên và các lớp
học. Cách phân tích đó cho thấy ảnh hưởng của đặc tính “chuộng hình
thức” lên khả năng học đọc của học sinh là có ý nghĩa thống kê.
Sau đó, Aitkin và đồng sự (1981) lại chứng minh rằng khi phân tích
mà có tính đến việc phân trẻ em theo nhóm vào các lớp học riêng biệt,
thì hồn tồn khơng có sự khác biệt mang tính thống kê giữa hai nhóm
học sinh “chuộng hình thức” và “khơng chuộng hình thức” về khả năng
học đọc. Kết quả phân tích này có ý nghĩa thống kê.

Cách phân tích này là một ví dụ quan trọng đầu tiên của phân tích
dữ liệu nhiều mức trong dữ liệu khoa học xã hội. Thực chất những gì
đang xảy ra ở đây là những trẻ em trong cùng một lớp học có xu hướng
tương tự nhau trong hoạt động của chúng. Cách lý giải khác là kỹ năng
học đọc có thể phụ thuộc nhiều vào khả năng truyền thụ của giáo viên
hơn là vào tính cách của học sinh. Kết quả là thơng tin được cung cấp
ít hơn rõ rệt so với trường hợp cũng những học sinh đó được giảng dạy
bởi các giáo viên khác nhau một cách riêng biệt. Nói cách khác, những
đơn vị cơ bản cho mục đích so sánh là giáo viên chứ không phải học sinh
.Vậy cần chuyển sang nghiên cứu kỹ năng giảng dạy của giáo viên.
7


Trong những bài toán như trên, chỉ dùng cách phân tích riêng rẽ
ở từng nhóm nhỏ mà khơng cần sử dụng mơ hình nhiều mức có được
khơng?

1.3

Mức độ chính xác của các kết luận thống kê

Nếu tăng số lượng học sinh (được chọn vào mẫu) trong mỗi lớp sẽ
làm tăng độ chính xác cho các kết luận thống kê đối với hiệu quả giảng
dạy của mỗi giáo viên, nhưng lại khó tăng được số giáo viên được đưa
vào xét trong nghiên cứu. Do vậy khơng tăng được tính chính xác trong
kết luận thống kê về hiệu quả giảng dạy của các giáo viên khác nhau.
Nếu tăng số giáo viên đưa vào mẫu nghiên cứu thì chúng ta sẽ tăng
độ chính xác của các phép so sánh về hiệu quả giảng dạy của các giáo
viên, nhưng lại làm giảm số học sinh xét đến trong mỗi lớp, do đó làm
giảm tính chính xác của các ước lượng đối với từng giáo viên.

Do vậy chúng ta cần phát triển các kỹ thuật phân tích nhiều mức.

1.4

Ưu thế của mơ hình nhiều mức

Thứ nhất, mơ hình nhiều mức cho phép thu được các ước lượng hiệu
quả đối với các hệ số hồi quy, khắc phục được hạn chế của giả thiết về
tính độc lập giữa các quan sát và giả thiết phương sai không đổi.
Thứ hai, với các thông tin được tổ chức theo “chùm”, sẽ thu được giá
trị chính xác hơn của các độ lệch tiêu chuẩn , khoảng tin cậy cũng như
xác suất ý nghĩa của các phép kiểm định. Thứ ba, với các hiệp biến, có
thể so sánh độ biến động của số liệu tại các nhóm thuộc các mức khác
8


nhau.
Thứ tư, với số lượng quan sát tương đối nhỏ ở các nhóm “cơ sở”, vẫn
có thể thu được các kết luận thống kê tốt cho mỗi nhóm bằng cách kết
hợp khai thác các thông tin ở các mức cao hơn hoặc từ tồn bộ số liệu.

1.5

Mơ hình tuyến tính nhiều mức và các ước lượng

Phần này giới thiệu mô hình hai mức cùng với các khái niệm cơ bản
sẽ được sử dụng trong các phần tiếp theo. Chúng ta xem xét những cách
khác nhau trong việc xây dựng và phát triển mơ hình cũng như giới
thiệu các thủ tục ước lượng các tham số, thiết kế và kiểm tra các hàm
của các tham số và xây dựng dựng khoảng tin cậy .

Để làm rõ vấn đề, chúng ta xét dữ liệu gồm 728 học sinh trong 50
trường cấp 1 ở London. Chúng ta xem xét hai thời điểm đo lường: Thời
điểm đầu là khi học sinh học lớp 4 của trường, tương ứng với năm các
em lên 8 tuổi và thời điểm thứ hai 3 năm sau đó, khi các em học năm
cuối ở trường tiểu học.
Chúng ta sử dụng điểm số bài kiểm tra mơn Tốn được thực hiện tại
hai thời điểm kể trên cùng với thông tin được sưu tập về lai lịch xã hội
và giới tính của học sinh.
Hình 1.1 là biểu đồ sự phân tán điểm kiểm tra mơn tốn của học sinh
11 tuổi với học sinh 8 tuổi. Trong biểu đồ này không cho thấy sự khác
biệt giữa học sinh thuộc các trường khác nhau.
Chú ý rằng đồ thị trên đây cho thấy có một khuynh hướng chung,
điểm số năm 8 tuổi có mối quan hệ hầu như đồng biến với điểm số năm
9


Hình 1.1: Sự phân tán điểm kiểm tra mơn tốn.

11 tuổi. Cũng cần chú ý rằng độ biến động của điểm số năm 11 tuổi sẽ
giảm đi nếu điểm số năm 8 tuổi của học sinh tăng lên.
Trong Hình 1.2 điểm số của 2 trường khác nhau đã được lựa chọn,
miêu tả bởi các ký hiệu khác nhau.

Hình 1.2:

Có hai điều thấy rõ ngay lập tức. So với trường được miêu tả bởi hình
tam giác, trường được miêu tả bởi hình trịn có độ dốc lớn hơn và điểm
10



số năm 11 tuổi có xu hướng thấp hơn tại hầu hết các nhóm học sinh có
cùng điểm số năm 8 tuổi. Những mối liên hệ này có thể được mơ hình
hóa như sau:
Đầu tiên chúng ta xét mơ hình đơn giản của một trường, liên kết
điểm năm 11 tuổi với điểm năm 8 tuổi. Ta viết
yi = α + βxi + ei

(1.1)

trong đó, α là hệ số chặn, β là hệ số dốc, ei là sai số ngẫu nhiên.
Đây là mơ hình chính thức mơ tả mối liên hệ đơn lẻ. Để miêu tả đồng
thời những mối liên hệ trong vài trường, ví dụ cho trường j , ta viết
yij = αj + βj xij + eij

(1.2)

Đây là mô hình chính thức cho hình 2 ở đó j quy ước cho đơn vị mức
2 và i quy ước cho đơn vị mức 1. Tuy nhiên (1.2) vẫn là mô hình đơn
giản, mặc dù đã miêu tả mối liên hệ tách rời của mỗi trường. Trong
một số trường hợp, ví dụ có vài trường và các điều quan tâm chính là
các trường trong mẫu, chúng ta có thể phân tích bằng cách sử dụng tất
cả 2n + 1 tham số, cụ thể là: (αi , βj ), j = 1, . . . , n với phần dư của các
trường có phương sai chung là σ 2 .

1.6

Mơ hình 2 mức với hệ số ngẫu nhiên

Để chính thức sử dụng (1.2) như một mơ hình 2 mức, chúng ta coi
αj , βj là các biến ngẫu nhiên, và để thuận tiện, thay thế các ký hiệu αj

bởi β0j và βj bởi β1j . Khi đó ta có

11


yij = β0j + β1j xij + eij

(1.3)

ở đó, β0j là hệ số chặn, β1j là hệ số dốc, eij là sai số ngẫu nhiên. Sự
khác biệt của mơ hình này so với mơ hình hồi quy thơng thường là chúng
ta đã giả sử rằng mỗi trường được đặc trưng bởi một hệ số chặn β0j khác
nhau và hệ số dốc β1j khác nhau. Các sai số ngẫu nhiên eij có kỳ vọng
0 và phương sai σj2 . Các mơ hình nhiều mức thường giả sử phương sai
của các sai số ngẫu nhiên giống nhau ở tất cả các trường bằng σ 2 .
Qua tất cả các trường, các hệ số hồi quy β.j có một phân bố với kỳ
vọng 0 và phương sai nào đó. Giả sử
β0j = β0 + u0j
β1j = β1 + u1j
trong đó u0j , u1j là các sai số ngẫu nhiên (còn gọi là phần dư) , thể hiện
độ lệch giữa các trường, với các tham số
E(u0j ) = E(u1j ) = 0
2
V ar(u0j ) = σu0
2
V ar(u1j ) = σu1

cov(u0j , u1j ) = σu01
Nói chung hiệp phương sai của các sai số ở mức trường khơng được giả
thiết bằng 0. Khi đó (1.3) có dạng

yij = β0 + β1 xij + (u0j + u1j xij + e0ij )
2
var(e0ij ) = σe0

12

(1.4)


Các hệ số β0 , β1 không thay đổi giữa các trường nên chúng khơng có
chỉ số j để biểu thị cho 1 trường nào mà chúng được áp dụng cho tất cả
các trường. Vì vậy các hệ số này được nói đến như các hệ số cố định, sự
biến đổi còn lại của tất cả các trường được thể hiện bởi β0j , β1j . Các hệ
số β0j , β1j được giả thiết thay đổi giữa các trường và được xác định qua
các phần dư u0j , u1j .
Trong công thức (1.4) phần β0 + β1 xij bao gồm tất cả các hệ số
cố định, nên phần này được gọi là phần cố định của mơ hình. Phần
(u0j + u1j xij + e0ij ) bao gồm tất cả các hệ số ngẫu nhiên, nên phần này
được gọi là phần ngẫu nhiên của mơ hình. Như vậy biến đáp ứng yij
được coi là tổng của 1 phần cố định và 1 phần ngẫu nhiên .
Chúng ta có thể viết lại phần cố định của (1.4) dưới dạng ma trận:
E(Y ) = Xβ
Y = {yij }
E(yij ) = Xij β = (Xβ)ij , X = {Xij }
Trong đó {} là kí hiệu ma trận, X là ma trận thiết kế của các biến giải
thích, ứng với mơ hình (1.4) ta có X = {1Xij } .
Các biến ngẫu nhiên được coi như số dư và trong trường hợp mơ hình
một mức số dư e0ij thường trở thành số dư của mô hình tuyến tính thơng
thường.
Để mơ hình có tính nhất qn, tức là mỗi hệ số phải gắn với một biến

giải thích, chúng ta có thể định nghĩa thêm một biến giải thích mới cho
hệ số chặn và số dư u0j tương ứng với nó, biến này được gọi là x0ij và
chỉ nhận một giá trị hằng số bằng 1.
13


Đặc điểm để phân biệt (1.4) với các mơ hình hồi quy tuyến tính hoặc
mơ hình phân tích phương sai thông thường là sự hiện diện của nhiều
hơn một số dư, điều này đưa đến địi hỏi phải có thủ tục đặc biệt để
ước lượng các tham số. Chú ý rằng cấu trúc của phần ngẫu nhiên trong
mơ hình đóng một vai trò then chốt. Đồng thời, trong phần cố định các
biến có thể được đo ở bất kỳ mức nào, ví dụ trong dữ liệu nghiên cứu
giáo dục trên đây, chúng ta có thể đo lường các đặc tính của nhà trường
hoặc của giáo viên. Chúng ta cũng có thể đưa vào mơ hình các biến tổng
hợp, chẳng hạn như điểm trung bình mơn tốn của học sinh 8 tuổi ở mỗi
trường. Sự hiện diện của các biến đó không giúp cải thiện thủ tục ước
lượng. Hơn nữa, các kết quả thu được từ đó cũng cần được giải thích
một cách cẩn thận.

1.7

Hệ số tương quan nội tại

Trong phương trình (1.4) cần ước lượng 2 hệ số cố định β0 , β1 và 4
2
2
2
2
. Đây là các tham số ngẫu nhiên tương
, σe0

tham số khác là σu0
, σu1
, σu01

ứng với phương sai và hiệp phương sai.
Chúng ta bắt đầu xem xét mơ hình 2 mức đơn giản nhất chỉ bao gồm
2
2
tham số ngẫu nhiên σu0
, σe0
,
2
2
var(yij |β0 , β1 , xij ) = var(u0 + e0ij ) = σu0
+ σe0
.

Đây là tổng phương sai ở mức 1 và mức 2.
Với dữ liệu nghiên cứu giáo dục xét đến trên đây, mơ hình này cho
thấy phương sai tồn phần cho mỗi học sinh là hằng số và hiệp phương
sai giữa 2 học sinh (kí hiệu i1 , i2 ) trong cùng một trường được cho bởi
14


2
cov(u0j + ei1 j , u0j + ei2 j ) = cov(u0j , u0j ) = σu0

vì các số dư ở mức 1 được giả sử là độc lập.
Sự không độc lập của các quan sát trong cùng một nhóm có thể được
biểu diễn qua một hệ số tương quan, hệ số tương quan nội tại nhóm, ký

hiệu là ρ. Do đó, hệ số tương quan giữa 2 học sinh là:

ρ=

2
σu0
2 + σ2
σu0
e0

Như vậy tương quan nội tại nhóm bằng tỷ lệ của phương sai mức
nhóm so với phương sai của tồn bộ ước lượng và nó được coi như là
tương quan nội tại trong đơn vị mức 2, trong trường hợp này là tương
quan nội tại lớp.
Trong mơ hình 3 mức là các mức trường, lớp và học sinh, chúng ta
có 2 mối tương quan nội tại, đó là mối tương quan nội tại trường đo
bằng tỷ lệ phương sai giữa các trường trên toàn bộ các phương sai và
mối tương quan nội tại lớp đo tương ứng bằng tỷ lệ của phương sai giữa
các lớp học trên phương sai toàn phần.
Bây giờ chúng ta xem xét chi tiết hơn ở cấu trúc tập dữ liệu 2 mức,
xem xét cấu trúc của hiệp phương sai trong ma trận A. Đây là ma trận
hiệp phương sai cấp 3x3 cho điểm số của 3 học sinh trong một trường:


2
2
2
2
σ + σe0
σu0

σu0
 u0



2
2
2
2
A=

σu0
σu0 + σe0
σu0


2
2
2
2
σu0
σu0
σu0
+ σe0
Đối với 2 học sinh của một trường khác, ta có ma trận hiệp phương sai
15


cấp 2x2 sau đây:


B=

2
σu0

+

2
σe0

2
σu0



2
σu0
2
σu0

+

2
σe0



Xét đồng thời 5 học sinh của 2 trường trên, ma trận hiệp phương sai sẽ
là ma trận khối chéo




A 0
0 B




Cấu trúc khối chéo phản ánh thực tế là hiệp phương sai giữa các học
sinh trong các trường khác nhau bằng 0. Ta có thể mở rộng việc biểu
diễn dạng khối chéo như trên ra cho ma trận hiệp phương sai của nhiều
học sinh của một số lượng tùy ý các đơn vị mức 2.
Ma trận khối chéo trên đây có thể viết đơn giản lại thành

V2 = 

2
J(3)
σu0

+

2
I(3)
σe0

0
2
J(2)
σu0


0



+

2
I(2)
σe0



trong đó I(n) là ma trận đơn vị cấp nxn, J(n) là ma trận cấp nxn với
tất cả các phần tử bằng 1.
2
Trong mơ hình hồi quy đơn bình phương bé nhất cổ điển, σu0
= 0 và

ma trận hiệp phương sai này được giản ước thành σ 2 I Với σ 2 là phương
sai của các phần dư.

16


1.8

Mơ hình 2 mức tổng qt bao gồm các hệ số
ngẫu nhiên


Chúng ta có thể mở rộng (1.4) để có nhiều hơn các biến giải thích với
hệ số dốc cố định,
p

βh xhij + (u0j + u1ij xij + e0ij )

yij = β0 + β1 xij +
h=2

Phương trình này có thể viết gọn lại thành
l

yij = Xij β +

huhj zhij + e0ij z0ij
h=0

trong đó, chúng ta sử dụng thêm biến giải thích Z cho phần ngẫu nhiên
của mơ hình và viết một cách tổng quát là
Z = {Z0 , Z1 }
với Z0 = {1} là vectơ bao gồm tất cả các thành phần bằng 1, còn
Z1 = {x1ij }.
Một biến giải thích có thể được đo ở mức bất kỳ nào đó, ví dụ chúng
ta có các đặc điểm học sinh đo được ở mức 1, hoặc đặc điểm của trường
đo được ở mức 2.
Trong mơ hình trên, hệ số dốc của biến giải thích X1 có phần ngẫu
nhiên ở mức 2, làm nảy sinh cấu trúc khối. Ma trận Ω2 là ma trận hiệp
phương sai của các phần ngẫu nhiên ở mức 2 của hệ số chặn và của hệ
số dốc. Ma trận Ω1 là ma trận hiệp phương sai các hệ số ngẫu nhiên mức
1. Trong này chỉ có duy nhất một thành phần phương sai ở mức 1. Ký


17


hiệu
2
2 2
2
A = (σu0
+ 2σu01 x1j + σu1
x1j + σe0
)
2
2 2 2
B = (σu0
+ σu01 (x1j + x2j ) + σu1
x1j x2j
2
2 2
2
C = (σu0
+ 2σu01 x2j + σu1
x2j + σe0
)

Khi đó



A B




B C



1 x1j

Xj = 

1.9

1





 = Xj Ω2 XjT + 




 , Ω2 = 

2j




Ω1

2
σu0
σu01
2
σu01 σu1

Ω1




2
 , Ω1 = σe0

Ước lượng cho mơ hình nhiều mức

Bây giờ, chúng ta trình bày khái quát về phương pháp Ước lượng bình
phương bé nhất suy rộng (GLS). Xét mơ hình đa thành phần phương
sai 2 mức đơn giản
yij = β0 + β1 xij + u0j + e0ij

(1.5)

2
2
trong đó, u0j ≈ N (0, σu0
), e0ij ≈ N (0, σe0
)


Giả sử chúng ta đã biết giá trị của các phương sai, khi đó có thể xây
dựng ngay ma trận hiệp phương sai dạng khối chéo, ký hiệu là V. Chúng
ta có thể dùng thủ tục ước lượng bình phương bé nhất thơng thường để
thu được ước lượng cho các hệ số cố định:
βˆ = (X T V −1 X)−1 X T V −1 Y

18

(1.6)


trong đó




X=




1
1
..
.

x11
x21
..

.











,Y = 







y11
y21
..
.











(1.7)

y nm m

1 x nm m

Với m là số đơn vị mức 2 và nj số đơn vị mức 1 trong đơn vị thứ j
mức 2. Khi số dư có phân phối chuẩn, (1.6) cũng cung cấp các ước lượng
hợp lý cực đại.
Thủ tục tính lặp sẽ được sử dụng trong quá trình ước lượng các tham
số của mơ hình trong phần tiếp sau đây. Chúng ta bắt đầu từ việc ước
lượng một cách hợp lý các tham số cố định. Người ta thường sử dụng
2
=0
phương pháp ước lượng bình phương bé nhất cổ điển và giả định σu0

để ước lượng giá trị ban đầu của hệ số cố định βˆ0 . Từ đó ta có cơng thức
tính các số dư thơ
y˜ij = yij − βˆ0 − βˆ1 xij

(1.8)

Vec tơ các số dư thô được viết thành
Y˜ = {˜
yij }
Xem xét ma trận tích chéo Y˜ Y˜ T chúng ta thấy kỳ vọng của ma trận

này chính là ma trận hiệp phương sai V. Như vậy, chúng ta có thể sử
dụng ma trận tích chéo đó thay cho vai trò của ma trận hiệp phương sai
trong bước tiếp theo của q trình lặp.
Chúng ta có thể sắp xếp lại ma trận tích chéo này thành một vectơ
bằng cách lần lượt nối chồng cột trước lên cột tiếp theo của ma trận.
19


Mối liên hệ giữa vectơ này và giá trị của các phương sai có thể được biểu
diễn như mơ hình hồi quy tuyến tính sau:










2
y˜11
2
y˜21
..
.

y˜n2 m m






 
 
 
=
 
 
 

2
σu0

+

2
σe0

2
σu0
..
.
2
2
σu0
+ σe0












2
+R = σu0 







1
1
..
.










 2 
+σe0 







1

1
0
..
.





+R (1.9)




1

trong đó, R là vectơ số dư .
Vế trái của (1.9) là vectơ đáp ứng trong mơ hình hồi quy tuyến tính
2

2
tương ứng
, σe0
và vế phải bao gồm 2 biến giải thích, với các hệ số σu0

cần ước lượng. Việc giải phương trình hồi quy trên đây sẽ cung cấp cho
chúng ta giá trị ước lượng của các phương sai, qua đó xác định được giá
trị mới của ma trận hiệp phương sai V. Đưa ma trận mới thu được vào
(1.6), chúng ta thu được ước lượng mới của các tham số cố định và sử
dụng chúng vào chu trình tiếp theo của quá trình lặp.
Ước lượng các tham số cố định đến khi chúng hội tụ, tức là khi giá
trị của các tham số tại hai bước lặp liên tiếp không thay đổi một cách
đáng kể. Cuối cùng chúng ta sẽ thu được ước lượng xấp xỉ của các tham
số cố định và các tham số ngẫu nhiên của mơ hình hồi quy nhiều mức.
Tổng hợp lại, q trình ước lượng tham số bằng phương pháp bình
phương bé nhất suy rộng gồm các bước sau:
+) Bước 1: Nhập số liệu.
2
+) Bước 2: Cho (σu0
= 0) , ước lượng “thô” ma trận hiệp phương sai

V.
+) Bước 3: Ước lượng βˆ = (X T V −1 X)−1 X T V −1 Y
20


2
2
, σe0
+) Bước 4: Giải phương trình hồi quy (1.9) để ước lượng σu0

2
2
.
và σe0
+) Bước 5: Kiểm tra tính hội tụ của các tham số σu0

Nếu chúng hội tụ thì quá trình kết thúc. Ngược lại, chúng ta lại lập
2
2
, sau đó quay lại
và σe0
ma trận hiệp phương sai V từ các giá trị của σu0

bước 3 và bắt đầu một chu trình mới.

1.10

Số dư trong mơ hình 2 mức

Trong mơ hình 1 mức đơn như (1.1), chúng ta thường ước lượng số
dư một cách đơn giản bằng . Trong mơ hình nhiều mức, chúng ta thường
có nhiều số dư ở các mức khác nhau. Cách ước lượng của các số dư đó
được trình bày tiếp sau đây.
Cho trước giá trị ước lượng của các tham số ước lượng, ta xem xét dự
đoán giá trị của từng số dư cụ thể, chẳng hạn như ứng với mức 2 trong
mô hình nhiều thành phần phương sai. Đối với mỗi đơn vị ở mức 2 phải

ˆ Ω)
ˆ
uˆ = E(u0j |Y, β,


(1.10)

Chúng ta sẽ coi đó là các số dư được ước lượng hoặc số dư được dự
đoán. Nếu bỏ qua phần biến động do chọn mẫu có thể xuất hiện khi ước
lượng tham số trong (1.10), chúng ta có
2
cov(˜
yij , u0j ) = var(u0j ) = σu0
2
cov(˜
yij , e0ij ) = σe0

(1.11)

2
2
var(˜
yij ) = σu0
+ σe0

Chúng ta coi (1.10) như là mơ hình hồi quy tuyến tính của u0j trên tập
21


của {˜
yij } cho đơn vị mức 2 thứ j , còn (1.11) xác định các đại lượng cần
ước lượng cho các hệ số hồi quy và đó chính là u0j .
Đối với mơ hình nhiều thành phần phương sai chúng ta thu được
uˆ0j =


nj σu2

˜j
2 )y
(nj σu2 + σe0

eˆ0ij = y˜ij − uˆ0j
y˜j =

y˜ij

/nj

i=1

Trong đó nj là số đơn vị mức 1 trong đơn vị mức 2 thứ j. Các ước
nj σu2

2 ) nhân với trung
(nj σu2 + σe0
bình của sai số thô thường được coi là nhân tố co vì ln có giá trị nhỏ

lượng số dư là chệch nhưng vững. Thừa số

hơn hoặc bằng 1. Khi nj tăng nhân tố này tiến dần đến 1, và khi số
lượng những đơn vị mức 1 trong một đơn vị mức 2 giảm, thì nhân tố
ước lượng co của u0j tiến gần đến 0 hơn.
Như vậy, các số dư đó có 2 vai trị. Có thể diễn giải chúng như các
biến ngẫu nhiên với phân phối mà giá trị tham số của nó cho ta biết độ

biến động giữa những đơn vị mức 2, cung cấp ước lượng hiệu quả cho
các hệ số cố định. Mặt khác, có thể coi chúng được như ước lượng đơn
lẻ của mỗi đơn vị mức 2 khi ta sử dụng giả thiết cho rằng chúng thuộc
về quần thể của các đơn vị dùng để dự đoán của chúng. Cụ thể, đối với
những đơn vị mức 2 mà ở đó chỉ có vài đơn vị mức 1, nếu khai thác cả
các thông tin từ các đơn vị mức 2 khác, chúng ta có thể thu được ước
lượng chính xác hơn là khi nếu chúng ta chỉ dùng thông tin của riêng
từng đơn vị mức 2 này. Điều này đặc biệt quan trọng đối với việc ước
lượng số dư của các hệ số ngẫu nhiên trong trường hợp mỗi đơn vị mức
22


2 chỉ có 1 đơn vị mức 1.
Như trong những mơ hình một mức, chúng ta có thể sử dụng những
số dư ước lượng được để kiểm tra giả thiết của mơ hình. Có hai giả thiết
thường được xét đến là giả thiết về tính phân phối chuẩn và tính phương
sai bất biến trong mơ hình. Chúng ta cần có ước lượng khoảng của các
tham số cũng như xác suất ý nghĩa của ước lượng điểm cho các số dư
hoặc các hàm của chúng. Các vấn đề đó được xét đến trong các mục tiếp
theo đây.

1.11

Ước lượng số dư trong mơ hình nhiều mức

Tập hợp của mh số dư ở mức h trong mơ hình nhiều mức được cho
bởi
Ph = {Ph1 , . . . , Phmh }, PhTi = {Phi1 , . . . , Phinh }
ở đó nh là số đơn vị mức h. Các số dư ở bất kỳ mức nào sẽ độc lập
với bất kỳ một số dư ở mức khác . Chúng ta quy định ước lượng số dư

được cho bởi
Pˆhi = E(Phi |Y˜ , V )
với Y˜ = Y − Xβ.
Chúng ta xem xét đường hồi quy của tập tất cả các số dư Ph trên Y˜
đưa ra ước lượng
Pˆh = RhT V −1 Y˜

(1.12)

với Rh là ma trận khối chéo, mỗi khối tương ứng với một đơn vị mức h
h
h
và khối thứ j được cho bởi Z(j)
Ωh , với Z(j)
là ma trận của các biến giải

thích với các hệ số ngẫu nhiên ở mức h. Chúng ta thu được các ước lượng
23


vững bằng cách thế một cách thích hợp các tham số trong (1.12) bằng
các ước lượng mẫu. Các ước lượng này là các hàm tuyến tính của các
giá trị đáp ứng và ma trận hiệp phương sai không điều kiện của chúng
được cho bởi
RhT V −1 (V − X(X T V −1 )−1 X T )V −1 Rh

(1.13)

Chú ý rằng khơng có hiệp phương sai giữa các đơn vị cùng mức Khi
muốn nghiên cứu các tính chất phân bố của số dư chuẩn hóa, ta có thể

dùng ma trận hiệp phương sai khơng điều kiện (1.13) để tiến hành chuẩn
hóa các số dư ước lượng được. Tuy nhiên, nếu ta đưa ra suy luận thống
kê cho giá trị đúng của Phj , chẳng hạn như về khoảng tin cậy hoặc kiểm
định sự khác nhau, thì cần sử dụng ma trận hiệp phương sai có điều
kiện của Pˆh hoặc E[(Pˆh − Ph )(Pˆh − Ph )T ] được đưa ra bằng cách gán các
tham số ước lượng được vào
Sh − RhT V −1 V − X(X T V −1 X)−1 X T V −1 Rh
với Sh là ma trận khối chéo, mỗi khối tương ứng đơn vị với mức h là
Ωh .

1.12

Kiểm định giả thuyết và khoảng tin cậy

Trong phần này, chúng ta làm việc với các thủ tục liên quan đến các
mẫu cỡ lớn để đưa ra ước lượng khoảng cho các tham số hoặc các hàm
tuyến tính của các tham số và tiến hành kiểm định các giả thuyết.

24


×