ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
PHẠM THỊ THU SƯƠNG
ỨNG DỤNG
PHÂN TÍCH SỐ LIỆU ĐỊNH TÍNH NHIỀU CHIỀU
VÀO BÀI TOÁN ĐÁNH GIÁ CHẤT LƯỢNG ĐÀO TẠO
CỦA TRƯỜNG ĐẠI HỌC
Chuyên ngành : Lý thuyết xác suất và thống kê toán học
Mã số : 60 46 15
LUẬN VĂN THẠC SĨ TOÁN HỌC
NGƯỜI HƯỚNG DẪN KHOA HỌC
TS TÔ ANH DŨNG
Thành phố Hồ Chí Minh - 2010
Lời cảm ơn 1 Luận văn thạc só toán học
LỜI CẢM ƠN
Đầu tiên tôi xin gửi lời tri ân đến ba mẹ đã nuôi dưỡng, giáo dục, tạo điều kiện tốt
nhất để tôi được học tập đến ngày hôm nay.
Tôi xin gửi lời cảm ơn chân thành đến Thầy − Tiến só Tô Anh Dũng đã tận tình
hướng dẫn, chỉ bảo, truyền đạt những ý tưởng quý báu cho tôi trong quá trình học tập cũng
như trong quá trình thực hiện luận văn.
Tôi cũng xin bày tỏ lòng kính trọng và biết ơn đến Thầy − PGS.TS Nguyễn Bác Văn
đã dạy cho chúng tôi - học viên khoá 17 - cách làm việc nghiêm túc và thấu đáo.
Xin chân thành cảm ơn các Thầy Cô trong Khoa Toán−Tin học Trường Đại học Khoa
học Tự nhiên Tp.HCM, các Thầy Cô trong Bộ môn Xác suất Thống kê, Thầy − Tiến só Dương
Tôn Đảm, đã tận tình giảng dạy, hướng dẫn, cung cấp cho tôi những kiến thức bổ ích trong
những năm học cao học.
Tôi cũng xin chân thành cảm ơn Ban Giám hiệu, Phòng Đào tạo Sau Đại học, Thư
viện trường cùng Quý Thầy Cô, Cán bộ công nhân viên Trường Đại học Khoa học Tự nhiên
Tp.HCM đã giúp đỡ, tạo điều kiện tốt nhất cho tôi trong suốt thời gian học tại trường.
Tôi xin chân thành cảm ơn Hiệu trưởng − PGS.TS Thái Bá Cần, Trưởng Phòng Đào
tạo − TS.Nguyễn Tiến Dũng của Trường Đại học Sư phạm Kỹ thuật Tp.HCM đã giúp đỡ,
tạo điều kiện cho tôi tham gia khoá học này.
Cuối cùng, xin cảm ơn các bạn lớp Cao học Toán khoá 17, đặc biệt là các bạn chuyên
ngành Xác suất Thống kê đã luôn sẵn sàng giúp đỡ, động viên, chia sẽ những khó khăn với
tôi trong suốt thời gian học.
Tp Hồ Chí Minh, tháng 09 năm 2010
Phạm Thò Thu Sương
Mục lục 2 Luận văn thạc só toán học
MỤC LỤC
Trang
Lời cảm ơn 1
Mục lục 2
Lời giới thiệu 5
Chương I: Kiến thức Đại số và Xác suất Thống kê 6
§1.1 Matrận 6
1.1.1 Biểu diễn ma trận dưới dạng các ma trận con . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.1.2 Matrậnxácđònhdương 6
1.1.3 Giátròriêngvàvector riêng 7
§1.2 Các đặc trưng của số liệu nhiều chiều . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.2.1 Trung bình và phương sai của biến ngẫu nhiên một chiều . . . . . . . . . . . . . . . . 11
1.2.2 Hiệp phương sai và hệ số tương quan của biến ngẫu nhiên hai chiều . . . . . . 11
1.2.2.1 Hiệpphươngsai 11
1.2.2.2 Hệsốtươngquan 12
1.2.3 Vectortrungbình 13
1.2.4 Matrậnhiệpphương sai 14
1.2.5 Matrậntươngquan 15
1.2.6 Tổhợptuyếntínhcủa cácbiến 16
1.2.6.1 Cáctính chấtcủamẫu 16
1.2.6.2 Cáctính chấtcủaphânphối 19
§1.3 Phânphốichuẩnnhiềuchiều 20
1.3.1 Hàm mật độ của phân phối chuẩn nhiều chiều . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.3.1.1 Hàm mật độ của phân phối chuẩn một chiều . . . . . . . . . . . . . . . . . . . . . 20
1.3.1.2 Hàm mật độ của phân phối chuẩn nhiều chiều . . . . . . . . . . . . . . . . . . . .20
1.3.1.3 Phươngsaitổngquát 20
1.3.1.4 Tính đa dạng của các ứng dụng chuẩn nhiều chiều . . . . . . . . . . . . . . . . 21
1.3.2 Các tính chất của biến ngẫu nhiên có phân phối chuẩn nhiều chiều . . . . . . . 21
Mục lục 3 Luận văn thạc só toán học
1.3.3 Ước lượng trong chuẩn nhiều chiều . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
1.3.3.1 Ước lượnghợplýcựcđại 24
1.3.3.2 Phân phối của y và S 25
Chương II: Phân tích hồi qui 27
§2.1 Hồiqui đabiến 27
2.1.1 Mô hình hồi qui đa biến với x cốđònh 27
2.1.2 Ước lượng bình phương bé nhất trong mô hình x cốđònh 28
2.1.3 Ước lượng cho σ
2
30
2.1.4 Môhìnhqui tâm 30
2.1.5 Kiểmđònhgiảthiết 32
2.1.5.1 Kiểmđònhhồiqui tổngthể 32
2.1.5.2 Kiểm đònh trên một tập con của β 33
2.1.6 R
2
trong hồi qui với x cốđònh 34
2.1.7 Sựlựachọntậpconphùhợp 35
2.1.7.1 Kiểm tra tất cả các tập con có thể . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.1.7.2 Sựlựachọntrònhảycấp 35
2.1.8 Hồi qui đa biến với x ngẫunhiên 36
§2.2 Hồiqui đabiếnnhiềuchiều 37
2.2.1 Mô hình hồi qui đa biến nhiều chiều với x cốđònh 37
2.2.2 Ước lượng bình phương bé nhất trong mô hình nhiều chiều . . . . . . . . . . . . .38
2.2.3 Các tính chất của ước lượng bình phương bé nhất
ˆ
B 39
2.2.4 Một ước lượng cho Σ 39
2.2.5 Môhìnhqui tâm 39
2.2.6 Kiểm đònh giả thiết trong hồi qui đa biến nhiều chiều . . . . . . . . . . . . . . . . . . 40
2.2.6.1 Kiểmđònhhồiqui tổngthể 40
2.2.6.2 Kiểm đònh trên một tập con các giá trò của x 42
2.2.7 Hồi qui đa biến nhiều chiều với x ngẫunhiên 43
Chương III: Phân tích nhân tố 44
§3.1 Môhìnhnhântố trựcgiao 44
3.1.1 Đònh nghóa mô hình và các giả thiết . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
Mục lục 4 Luận văn thạc só toán học
3.1.2 Tính không duy nhất của các hệ số tải . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
§3.2 Ước lượng các hệ số tải và phương sai tương đối . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .50
3.2.1 Phươngphápthànhphầnchính 50
3.2.2 Phươngphápnhântố chính 53
3.2.3 Phươngphápnhântố chínhlặp 55
3.2.4 Phươngpháphợplýcựcđại 55
§3.3 Chọnlựa sốnhântố 57
§3.4 Phépquay 59
3.4.1 Giớithiệu 59
3.4.2 Phépquaytrựcgiao 59
3.4.2a Phương phápđồthò 60
3.4.2b Phépquayvarimax 60
3.4.3 Phépquayxiên 60
3.4.4 Sựgiảithíchcácnhântố 61
§3.5 Giátrònhântố 62
Chương IV: Ứng dụng vào bài toán đánh giá chất lượng đào tạo của trường Đại học . 64
4.1 Bàitoán 64
4.2 Mô tả số liệu và Phân tích, đánh giá. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .64
4.3 Nhậnxét 76
Kết luận 77
Tài liệu tham khảo 78
Lời giới thiệu 5 Luận văn thạc só toán học
LỜI GIỚI THIỆU
Phân tích số liệu nhiều chiều được ứng dụng khá rộng rãi trong nhiều lónh vực như giáo
dục, hóa học, vật lý, đòa chất, kỹ thuật, pháp luật, kinh doanh, ngôn ngữ học, sinh học, tâm
lý học để đưa ra những đánh giá đánh tin cậy cho nhiều vấn đề dựa trên bộ số liệu phù
hợp.
Hiện nay, với sự hỗ trợ của máy điện toán, có rất nhiều phương pháp phân tích số liệu
nhiều chiều hiệu quả được xây dựng và ứng dụng. Trong phạm vi luận văn này, chúng tôi
sẽ giới thiệu một số phương pháp phân tích số liệu nhiều chiều như phân tích hồi qui tuyến
tính, phân tích nhân tố và áp dụng chúng vào bài toán đánh giá chất lượng đào tạo ở trường
Đại học Sư phạm Kỹ thuật Tp.HCM. Luận văn gồm có 4 chương:
Chương I: Kiến thức đại số và xác suất thống kê. Chương này trình bày các kiến thức cơ
sở cần cho các chương tiếp theo bao gồm: ma trận, các đặc trưng của số liệu nhiều chiều,
phân phối chuẩn nhiều chiều.
Chương II: Phân tích hồi qui nhiều chiều. Trong chương này, chúng ta nghiên cứu hai
dạng phân tích hồi qui là hồi qui đa biến với x cố đònh và hồi qui đa biến với x ngẫu nhiên
cho trường hợp một chiều và trường hợp nhiều chiều.
Chương III: Phân tích nhân tố. Chương này trình bày việc giảm số lượng biến bằng cách
sử dụng một số nhân tố ít hơn, sử dụng phép quay trực giao và phép quay xiên.
Chương IV: Ứng dụng vào bài toán đánh giá chất lượng đào tạo của trường Đại học.
Chương này trình bày nhiều bộ số liệu thu thập được như số nhận xét của sinh viên về hoạt
động giảng dạy của giảng viên đầu ba năm học 07-08, 08-09, và 09-10; số lượng sinh viên
đầu vào từ năm 2001 đến 2008 và kết quả học tập trong ba năm học đầu tiên của số sinh
viên này; kết quả khảo sát mức độ hài lòng của sinh viên sau khi tốt nghiệp trong bốn đợt
tháng 05/08, tháng 12/08, tháng 06/09 và tháng 12/09; kèm theo là kết quả phân tích để
đánh giá chất lượng đào tạo tại trường Đại học Sư phạm Kỹ thuật Tp.HCM, thông qua việc
áp dụng phương pháp phân tích hồi qui và phương pháp phân tích nhân tố.
Chương I: Kiến thức Đại số và Xác suất Thông kê 6 Luận văn thạc só toán học
CHƯƠNG I:
KIẾN THỨC ĐẠI SỐ VÀ XÁC SUẤT THỐNG KÊ
§ 1.1 MA TRẬN
1.1.1 Biểu diễn ma trận dưới dạng các ma trận con
Để thuận tiện ta thường chia nhỏ ma trận dưới dạng các ma trận con. Chẳng hạn chia
nhỏ ma trận A thành bốn ma trận con như sau:
A =
A
11
A
12
A
21
A
22
Xét tích hai ma trận A và B. Nếu hai ma trận A và B được chia nhỏ sao cho các ma
trận con là tương thích của phép nhân ma trận thì tích AB có thể được biểu diễn dưới dạng
phép nhân ma trận thông thường:
AB =
A
11
A
12
A
21
A
22
B
11
B
12
B
21
B
22
=
A
11
B
11
+ A
12
B
21
A
11
B
12
+ A
12
B
22
A
21
B
11
+ A
22
B
21
A
21
B
12
+ A
22
B
22
(1.1.1)
Nhân một ma trận với một vector dưới dạng ma trận được chia nhỏ như sau:
Ab =
A
1
A
2
b
1
b
2
= A
1
b
1
+ A
2
b
2
(1.1.2)
Nếu A được chia nhỏ thành A =(A
1
,A
2
) thì ma trận chuyển vò A
là:
A
=(A
1
,A
2
)
=
A
1
A
2
1.1.2 Ma trận xác đònh dương
Ma trận đối xứng A được gọi là xác đònh dương nếu x
Ax > 0 với mọi vector x =0.
Tương tự, A là ma trận nửa xác đònh dương nếu x
Ax ≥ 0 với mọi vector x =0.
với
x
Ax =
i
a
ii
x
2
i
+
i=j
a
ij
x
i
x
j
Chương I: Kiến thức Đại số và Xác suất Thông kê 7 Luận văn thạc só toán học
Các phần tử trên đường chéo a
ii
của ma trận xác đònh dương là dương. Tương tự cho
ma trận nửa xác đònh dương, a
ii
≥ 0 với mọi i.
Nếu A = B
B với B là n × p, có hạng p<nthì B
B xác dònh dương. Thật vậy:
x
Ax = x
B
Bx =(Bx)
(Bx)=z
z =
n
i=1
z
2
i
> 0
với z = Bx (Bx không thể bằng 0 ngoại trừ x =0vì B có hạng đủ). Nếu B không có hạng
đủ thì B
B là nửa xác đònh dương.
Một ma trận xác đònh dương A có thể phân tách thành :
A = T
T (1.1.3)
với T là ma trận nửa tam giác trên. Theo thuật toán Cholesky, các phần tử của T được tính
như sau:
Đặt A =(a
ij
) và T =(t
ij
) là n ×n, thì:
t
11
=
√
a
11
; t
1j
=
a
1j
t
11
2 ≤ j ≤ n,
t
ii
=
a
ii
−
i−1
k=1
t
2
ki
2 ≤ i ≤ n,
t
ij
=
a
ij
−
i−1
k=1
t
ki
t
kj
t
ii
2 ≤ i<j≤ n,
t
ij
=0 1≤ j<i≤ n
1.1.3 Giá trò riêng và vector riêng
1.1.3.1 Đònh nghóa
Với mọi ma trận vuông A, một vô hướng λ và một vector x khác 0 thỏa:
Ax = λx. (1.1.4)
thì λ được gọi là một giá trò riêng của A và x là vector riêng của A ứng với λ, cũng có thể
viết:
(A − λI)x = 0. (1.1.5)
Nếu |A −λI|=0thì (A −λI) có nghòch đảo và x = 0 là nghiệm duy nhất. Vì vậy để
có nghiệm không tầm thường, ta thiết lập |A −λI| =0để tìm giá trò λ và thay vào (1.1.5)
để tìm giá trò x tương ứng.
Phương trình |A −λI| =0gọi là phương trình đặc trưng. Nếu A là n ×n, A sẽ có n
vector riêng λ
1
,λ
2
, ,λ
n
. Các giá trò λ không nhất thiết phân biệt hay khác 0.
Chương I: Kiến thức Đại số và Xác suất Thông kê 8 Luận văn thạc só toán học
Ta nhân hai vế của (1.1.5) với một vô hướng k, ta được:
(A − λI)kx = k0 = 0. (1.1.6)
Như vậy nếu x là một vector riêng của A thì kx cũng là một vector riêng. Do đó ta có thể
chuẩn hóa vector riêng x: x
x =1.
1.1.3.2 Vết và đònh thức của ma trận A
Giả sử ma trận vuông A có các giá trò riêng là λ
1
,λ
2
, ,λ
n
. Lúc đó, ta có:
tr(A)=
n
i=1
λ
i
(1.1.7)
|A| =
n
i=1
λ
i
(1.1.8)
1.1.3.3 Ma trận xác đònh và nửa xác đònh dương
Giá trò riêng và vector riêng của ma trận xác đònh dương và nửa xác đònh dương có tính
chất:
1. Tất cả giá trò riêng của ma trận xác đònh dương là dương.
2. Giá trò riêng của ma trận nửa xác đònh dương là dương hoặc bằng không. Số
giá trò riêng dương bằng hạng của ma trận.
1.1.3.4 Ma trận tích AB
Nếu A và B là ma trận vuông và cùng kích cỡ thì các giá trò riêng của AB giống BA,
mặc dù vector riêng thường khác nhau. Nếu AB và BA là vuông, khác kích cỡ thì các giá
trò riêng khác không của AB và BA là giống nhau.
1.1.3.5 Ma trận đối xứng
Nếu ma trận C =(x
1
, x
2
, ,x
n
) chứa các vector riêng chuẩn hoá của ma trận đối xứng
A (n ×n) thì C trực giao. Với I = CC
= C
C. Ta có:
A = ACC
A = A(x
1
, x
2
, ,x
n
)C
Chương I: Kiến thức Đại số và Xác suất Thông kê 9 Luận văn thạc só toán học
=(Ax
1
, Ax
2
, ,Ax
n
)C
=(λ
1
x
1
,λ
2
x
2
, ,λ
n
x
n
)C
= CDC
(1.1.9)
với
D =
λ
1
0 0
0 λ
2
0
.
.
.
.
.
.
.
.
.
00 λ
n
(1.1.10)
Mặt khác, C
AC = D.
1.1.3.6 Ma trận căn bậc hai
Nếu A là ma trận xác đònh dương, thì
A
1/2
= CD
1/2
C
(1.1.11)
với
D
1/2
=
√
λ
1
0 0
0
√
λ
2
0
.
.
.
.
.
.
.
.
.
00
√
λ
n
(1.1.12)
A
1/2
A
1/2
=(A
1/2
)
2
= A. (1.1.13)
1.1.3.7 Ma trận bình phương và ma trận nghòch đảo
Nếu ma trận vuông, đối xứng A có các giá trò riêng λ
1
,λ
2
, ,λ
n
và các vector riêng
tương ứng x
1
, x
2
, ,x
n
thì A
2
có các giá trò riêng λ
2
1
,λ
2
2
, ,λ
2
n
với các vector riêng
x
1
, x
2
, ,x
n
. Nếu A khả nghòch thì A
−1
có các giá trò riêng 1/λ
1
, 1/λ
2
, ,1/λ
n
và các
vector riêng x
1
, x
2
, ,x
n
.
A
2
= CD
2
C
, (1.1.14)
A
−1
= CD
−1
C
, (1.1.15)
với C =(x
1
, x
2
, ,x
n
) chứa các vector riêng chuẩn hoá của A (và của A
2
, A
−1
),
D
2
= diag(λ
2
1
,λ
2
2
, ,λ
2
n
) và D
−1
= diag(1/λ
1
, 1/λ
2
, ,1/λ
n
).
Chương I: Kiến thức Đại số và Xác suất Thông kê 10 Luận văn thạc só toán học
1.1.3.8 Phân tích giá trò suy biến
Chúng ta có thể biểu diễn ma trận thực A dưới hình thức các giá trò riêng và vector
riêng của A
A và AA
. Đặt A là ma trận n × p, có hạng k. Phân tích giá trò suy biến của
A là:
A = UDV
(1.1.16)
với U
n×k
, D
k×k
, và V
p×k
. Các phần tử trên đường chéo của ma trận D = diag(λ
1
,λ
2
, ,λ
k
)
là căn bậc hai của các giá trò riêng khác 0 của A
A hay của AA
; k cột của U là các vector
riêng chuẩn hoá của AA
tương ứng các giá trò riêng λ
2
1
,λ
2
2
, ,λ
2
k
; k cột của V là các
vector riêng chuẩn hoá của A
A tương ứng các giá trò riêng λ
2
1
,λ
2
2
, ,λ
2
k
. Vì các cột của
U và V là các vector riêng chuẩn hoá của ma trận đối xứng, ta có U
U = V
V = I.
Chương I: Kiến thức Đại số và Xác suất Thông kê 11 Luận văn thạc só toán học
§ 1.2 CÁC ĐẶC TRƯNG CỦA SỐ LIỆU NHIỀU CHIỀU
1.2.1 Trung bình và phương sai của biến ngẫu nhiên một chiều
Biến ngẫu nhiên là biến mà giá trò phụ thuộc vào kết quả của một thí nghiệm ngẫu
nhiên.
Trung bình phân phối của một biến ngẫu nhiên y là trung bình của tất cả các giá trò có
thể có của y, được ký hiệu là µ, cũng được đề cập đến như giá trò kỳ vọng của y, E(y).
Trung bình mẫu của một mẫu ngẫu nhiên cỡ ny
1
,y
2
, ,y
n
là:
y =
1
n
n
i=1
y
i
(1.2.1)
Tổng quát, y không bằng µ, tuy nhiên ta xem y là ước lượng tốt cho µ vì E(y)=µ và
var(y)=σ
2
/n với σ
2
là phương sai của y.
Một số tính chất:
1. E(ay)=aE(y)=aµ (1.2.2)
2. Nếu z
i
= ay
i
i =1, 2, ,n thì z = ay (1.2.3)
Phương sai: var(y)=σ
2
= E(y −µ)
2
. Đây là độ lệch bình phương trung bình, biểu thò
mức độ phân tán các giá trò của y. Phân tích, ta được:
σ
2
= E(y
2
) − µ
2
Phương sai mẫu: s
2
=
n
i=1
(y
i
− y)
2
n − 1
. (1.2.4)
Phân tích, ta được:
s
2
=
n
i=1
y
2
i
−ny
2
n − 1
(1.2.5)
Tổng quát, s
2
không bằng σ
2
, nhưng nó là ước lượng không chệch của σ
2
, E(s
2
)=σ
2
.
Căn bậc hai của phương sai được gọi là độ lệch tiêu chuẩn.
3. var(ay)=a
2
σ
2
. Tương tự, nếu z
i
= ay
i
i =1, 2, ,n thì s
2
z
= a
2
s
2
. (1.2.6)
1.2.2 Hiệp phương sai và hệ số tương quan của biến ngẫu nhiên hai chiều
1.2.2.1 Hiệp phương sai
Hai biến x và y được đo lường trên hai đơn vò khác nhau. Hiệp phương sai của biến
Chương I: Kiến thức Đại số và Xác suất Thông kê 12 Luận văn thạc só toán học
ngẫu nhiên hai chiều (x, y) được đònh nghóa là:
cov(x, y)=σ
xy
= E[(x − µ
x
)(y − µ
y
)]
với µ
x
và µ
y
là trung bình của x và y tương ứng.
Phân tích, ta được:
σ
xy
= E(xy) − µ
x
µ
y
.
Một số tính chất:
1. E(x + y)=E(x)+E(y)
2. E(xy)=E(x)E( y) nếu x và y độc lập.
Hiệp phương sai mẫu được đònh nghóa là:
s
xy
=
n
i=1
(x
i
−x)(y
i
− y)
n −1
. (1.2.7)
Phân tích, ta được:
s
xy
=
n
i=1
x
i
y
i
− nxy
n − 1
Về bản chất s
xy
không bằng σ
xy
, tuy nhiên s
xy
là một ước lượng không chệch cho σ
xy
,
E(s
xy
)=σ
xy
.
1.2.2.2 Hệ số tương quan
Hệ số tương quan của hai biến ngẫu nhiên x và y là:
ρ
xy
= corr(x, y)=
σ
xy
σ
x
σ
y
=
E[(x −µ
x
)(y −µ
y
)]
E(x − µ
x
)
2
E(y − µ
y
)
2
(1.2.8)
Hệ số tương quan mẫu là:
r
xy
=
s
xy
s
x
s
y
=
n
i=1
(x
i
−x)(y
i
− y)
n
i=1
(x
i
− x)
2
n
i=1
(y
i
−y)
2
(1.2.9)
Cả hai hệ số tương quan này biến thiên từ −1 đến 1.
Hệ số tương quan mẫu r
xy
là cosin của góc giữa hai vector. Đặt θ là góc giữa hai vector a
và b, ta có:
cosθ =
a
a + b
b +(b −a)
(b − a)
2
(a
a)(b
b)
=
a
a + b
b − (b
b + a
a − 2a
b)
2
(a
a)(b
b)
=
a
b
(a
a)(b
b)
Chương I: Kiến thức Đại số và Xác suất Thông kê 13 Luận văn thạc só toán học
1.2.3 Vector trung bình
Giả sử mẫu gồm n cá thể, mỗi cá thể được đo lường p thành phần thì ta biểu diễn n
vector cá thể y
1
, y
2
, ,y
n
là:
y
i
=
y
i1
y
i2
.
.
.
y
ip
Vector trung bình mẫu
y là trung bình của n vector quan trắc hay trung bình của p biến
riêng biệt:
y =
1
n
n
i=1
y
i
=
y
1
y
2
.
.
.
y
p
(1.2.10)
với
y
j
=
n
i=1
y
ij
/n là trung bình của n quan trắc trên biến thứ j.
n vector quan trắc y
1
, y
2
, ,y
n
có thể biểu diễn dưới dạng ma trận dữ liệu Y như sau:
Y =
y
1
y
2
.
.
.
y
i
.
.
.
y
n
=
y
11
y
21
.
.
.
y
i1
.
.
.
y
n1
y
12
y
22
.
.
.
y
i2
.
.
.
y
n2
y
1j
y
2j
.
.
.
y
ij
.
.
.
y
nj
y
1p
y
2p
.
.
.
y
ip
.
.
.
y
np
(1.2.11)
Hàng i của ma trận Y chỉ cá thể i, cột j của ma trận Y chỉ biến j.
Vector trung bình của phân phối hoặc kỳ vọng của y được đònh nghóa là vector các kỳ vọng
của mỗi biến:
E(y)=E
y
1
y
2
.
.
.
y
p
=
E(y
1
)
E(y
2
)
.
.
.
E(y
p
)
=
µ
1
µ
2
.
.
.
µ
p
= µ.
Tương tự,
y là ước lượng không chệch của µ : E(y)=µ.
Chương I: Kiến thức Đại số và Xác suất Thông kê 14 Luận văn thạc só toán học
1.2.4 Ma trận hiệp phương sai
Ma trận hiệp phương sai mẫu S =(s
jk
) là ma trận gồm phương sai và hiệp phương sai
của p biến:
S =(s
jk
)=
s
11
s
21
.
.
.
s
p1
s
12
s
22
.
.
.
s
p2
s
1p
s
2p
.
.
.
s
pp
(1.2.12)
Trong S, phương sai mẫu của p biến nằm trên đường chéo, hiệp phương sai mẫu của
từng cặp biến nằm bên ngoài đường chéo.
Phương sai mẫu của biến j : s
jj
= s
2
j
sử dụng cột j của Y:
s
jj
= s
2
j
=
1
n − 1
n
i=1
(y
ij
− y
j
)
2
(1.2.13)
=
1
n − 1
i
y
2
ij
− ny
2
j
Hiệp phương sai mẫu của biến thứ j và k, s
jk
được tính toán như trong (1.2.7), sử dụng
cột thứ j và thứ k của Y:
s
jk
=
1
n − 1
n
i=1
(y
ij
− y
j
)(y
ik
− y
k
) (1.2.14)
=
1
n − 1
i
y
ij
y
ik
− ny
j
y
k
Ta có S là đối xứng vì s
jk
= s
kj
. S cũng có thể biểu diễn dưới dạng n vector quan trắc:
S =
1
n − 1
n
i=1
(y
i
− y)(y
i
− y)
(1.2.15)
=
1
n − 1
n
i=1
y
i
y
i
− nyy
(1.2.16)
vì (y
i
− y)
=(y
i1
− y
1
,y
i2
− y
2
, ,y
ip
− y
p
). Phần tử (1,1) của (y
i
− y)(y
i
− y)
là
(y
i1
−y
1
)
2
, lấy tổng theo i trong (1.2.15) ta được s
11
như trong (1.2.13). Tương tự, phần tử
(1,2) của (y
i
− y)(y
i
− y)
là (y
i1
− y
1
)(y
i2
− y
2
).
Ma trận hiệp phương sai của phân phối là:
Σ = cov(y)=
σ
11
σ
21
.
.
.
σ
p1
σ
12
σ
22
.
.
.
σ
p2
σ
1p
σ
2p
.
.
.
σ
pp
(1.2.17)
Các phần tử trên đường chéo σ
jj
= σ
2
j
là các phương sai phân phối các giá trò của biến y,
Chương I: Kiến thức Đại số và Xác suất Thông kê 15 Luận văn thạc só toán học
các phần tử ngoài đường chéo σ
jk
là các hiệp phương sai phân phối các giá trò của biến y.
Ma trận hiệp phương sai phân phối trong (1.2.17) cũng được biểu diễn dưới dạng:
Σ = E[(y −µ)(y − µ)
] (1.2.18)
= E(yy
) − µµ
(1.2.19)
Vì E(s
jk
)=σ
jk
với mọi j, k, ma trận hiệp phương sai mẫu S là một ước lượng không chệch
cho Σ:
E(S)=Σ (1.2.20)
1.2.5 Ma trận tương quan
Hệ số tương quan mẫu giữa biến thứ j và thứ k được đònh nghóa trong (1.2.9) là:
r
jk
=
s
jk
√
s
jj
s
kk
=
s
jk
s
j
s
k
(1.2.21)
Ma trận tương quan mẫu:
R =(r
jk
)=
1
r
21
.
.
.
r
p1
r
12
1
.
.
.
r
p2
r
1p
r
2p
.
.
.
1
(1.2.22)
Ta có R là đối xứng vì r
jk
= r
kj
.
Ma trận tương quan có thể suy ra từ ma trận hiệp phương sai và ngược lại ma trận hiệp
phương sai có thể suy ra từ ma trận tương quan. Thật vậy,
Đặt
D
s
= diag(
√
s
11
,
√
s
22
, ,
√
s
pp
)
= diag(s
1
,s
2
, ,s
p
)
=
s
1
0
.
.
.
0
0
s
2
.
.
.
0
0
0
.
.
.
s
p
(1.2.23)
Ta có:
R = D
−1
s
SD
−1
s
(1.2.24)
S = D
s
RD
s
(1.2.25)
Ma trận tương quan của phân phối được đònh nghóa là:
Chương I: Kiến thức Đại số và Xác suất Thông kê 16 Luận văn thạc só toán học
P
ρ
=(ρ
jk
)=
1
ρ
21
.
.
.
ρ
p1
ρ
12
1
.
.
.
ρ
p2
ρ
1p
ρ
2p
.
.
.
1
(1.2.26)
với
ρ
jk
=
σ
jk
σ
j
σ
k
như trong (1.2.8)
1.2.6 Tổ hợp tuyến tính của các biến
1.2.6.1 Các tính chất của mẫu
Chúng ta nghiên cứu kỳ vọng, phương sai và hiệp phương sai của tổ hợp tuyến tính các
biến.
Đặt a
1
,a
2
, ,a
p
là các hằng số, ta xem xét tổ hợp tuyến tính các thành phần của vector
y:
z = a
1
y
1
+ a
2
y
2
+ + a
p
y
p
= a
y, (1.2.27)
với a
=(a
1
,a
2
, ,a
p
).
Nếu vector a gắn với mỗi y
i
trong một mẫu, ta có:
z
i
= a
1
y
i1
+ a
2
y
i2
+ + a
p
y
ip
= a
y
i
, i =1,2, ,n. (1.2.28)
Trung bình mẫu của z bằng trung bình của n giá trò z
1
= a
y
1
,z
2
= a
y
2
, ,z
n
= a
y
n
;
hay tổ hợp tuyến tính của
y, vector trung bình mẫu của y
1
, y
2
, ,y
n
:
z =
1
n
n
i=1
z
i
= a
y. (1.2.29)
Tương tự, phương sai mẫu của các z
i
= a
y
i
,i=1, 2, ,n là:
s
2
z
=
n
i=1
(z
i
− z)
2
n −1
= a
Sa. (1.2.30)
Vì phương sai luôn luôn không âm, nên ta có s
2
z
≥ 0, và do đó a
Sa ≥ 0 với mọi a.
Nếu chúng ta đònh nghóa một tổ hợp tuyến tính khác là :
w = b
y = b
1
y
1
+ b
2
y
2
+ + b
p
y
p
,
với b
=(b
1
,b
2
, ,b
p
) thì
Hiệp phương sai mẫu của z và w là:
Chương I: Kiến thức Đại số và Xác suất Thông kê 17 Luận văn thạc só toán học
s
zw
=
n
i=1
(z
i
− z)(w
i
− w)
n − 1
= a
Sb. (1.2.31)
Hệ số tương quan mẫu giữa z và w là:
r
zw
=
s
zw
s
2
z
s
2
w
=
a
Sb
(a
Sa)(b
Sb)
. (1.2.32)
Bây giờ chúng ta ký hiệu hai vector hằng a và b là a
1
và a
2
cho tiện và đặt:
A =
a
1
a
2
và
z =
a
1
y
a
2
y
=
z
1
z
2
.
z =
a
1
a
2
y = Ay.
Lúc đó trung bình của z là:
z =
z
1
z
2
=
a
1
y
a
2
y
(1.2.33)
=
a
1
a
2
y = Ay. (1.2.34)
Chúng ta sử dụng (1.2.30) và (1.2.31) để xây dựng ma trận hiệp phương sai mẫu cho z:
S
z
=
s
2
z
1
s
z
1
z
2
s
z
2
z
1
s
2
z
2
=
a
1
Sa
1
a
1
Sa
2
a
2
Sa
1
a
2
Sa
2
. (1.2.35)
S
z
=
a
1
a
2
S(a
1
, a
2
)=ASA
. (1.2.36)
Nếu chúng ta có k tổ hợp tuyến tính được biểu diễn là:
z
1
= a
11
y
1
+ a
12
y
2
+ + a
1p
y
p
= a
1
y
z
2
= a
21
y
1
+ a
22
y
2
+ + a
2p
y
p
= a
2
y
.
.
.
.
.
.
z
k
= a
k1
y
1
+ a
k2
y
2
+ + a
kp
y
p
= a
k
y
Ta có thể biểu diễn dưới dạng ma trận như sau:
Chương I: Kiến thức Đại số và Xác suất Thông kê 18 Luận văn thạc só toán học
z =
z
1
z
2
.
.
.
z
k
=
a
1
y
a
2
y
.
.
.
a
k
y
=
a
1
a
2
.
.
.
a
k
y = Ay
với z là k × 1, A là k ×p, và y là p × 1 (k ≤ p). Nếu z
i
= Ay
i
với mọi y
i
, i =1,2, ,n
thì theo (1.2.29), vector trung bình mẫu của z là:
z =
a
1
y
a
2
y
.
.
.
a
k
y
=
a
1
a
2
.
.
.
a
k
y = Ay. (1.2.37)
Bằng cách mở rộng (1.2.35), ma trận hiệp phương sai mẫu của z trở thành:
S
z
=
a
1
Sa
1
a
1
Sa
2
a
1
Sa
k
a
2
Sa
1
a
2
Sa
2
a
2
Sa
k
.
.
.
.
.
.
.
.
.
a
k
Sa
1
a
k
Sa
2
a
k
Sa
k
(1.2.38)
=
a
1
(Sa
1
Sa
2
Sa
k
)
a
2
(Sa
1
Sa
2
Sa
k
)
.
.
.
.
.
.
.
.
.
a
k
(Sa
1
Sa
2
Sa
k
)
=
a
1
a
2
.
.
.
a
k
(Sa
1
, Sa
2
, ,Sa
k
)
=
a
1
a
2
.
.
.
a
k
S(a
1
, a
2
, ,a
k
)
= ASA
(1.2.39)
Trường hợp tổng quát:
z
i
= Ay
i
+ b, i =1, 2, ,n. (1.2.40)
Vector trung bình mẫu và ma trận hiệp phương sai của z là:
Chương I: Kiến thức Đại số và Xác suất Thông kê 19 Luận văn thạc só toán học
z = Ay + b, (1.2.41)
S
z
= ASA
. (1.2.42)
1.2.6.2 Các tính chất của phân phối
Đặt z = a
y, với a là vector hằng.
Kỳ vọng của z là:
E(z)=E(a
y)=a
E(y)=a
µ, (1.2.43)
Phương sai của z là:
σ
2
z
= var(a
y)=a
Σa. (1.2.44)
Đặt w = b
y, với b là vector hằng khác a.
Hiệp phương sai của z = a
y và w = b
y là:
cov(z, w)=σ
zw
= a
Σb. (1.2.45)
Theo (1.2.8) hệ số tương quan của z và w là:
ρ
zw
=
σ
zw
σ
z
σ
w
=
a
Σb
(a
Σa)( b
Σb)
. (1.2.46)
Nếu Ay biểu diễn một số tổ hợp tuyến tính, thì vector kỳ vọng và ma trận hiệp phương sai
là:
E(Ay)=AE(y)=Aµ, (1.2.47)
cov(Ay)=AΣA
. (1.2.48)
Trường hợp tổng quát, z = Ay + b. Lúc đó ta có vector kỳ vọng và ma trận hiệp phương
sai là:
E(Ay + b)=AE(y)+b = Aµ + b, (1.2.49)
cov(Ay + b)=AΣA
. (1.2.50)
Chương I: Kiến thức Đại số và Xác suất Thông kê 20 Luận văn thạc só toán học
§ 1.3 PHÂN PHỐI CHUẨN NHIỀU CHIỀU
1.3.1 Hàm mật độ của phân phối chuẩn nhiều chiều
1.3.1.1 Hàm mật độ của phân phối chuẩn một chiều
Nếu một biến ngẫu nhiên y có phân phối chuẩn với kỳ vọng µ và phương sai σ
2
, thì
hàm mật độ cho bởi:
f(y)=
1
√
2π
√
σ
2
e
−(y−µ)
2
/2σ
2
, −∞ <y<∞. (1.3.1)
Khi y có hàm mật độ (1.3.1), ta nói y có phân phối chuẩn N(µ, σ
2
).
1.3.1.2 Hàm mật độ của phân phối chuẩn nhiều chiều
Nếu y có phân phối chuẩn nhiều chiều với vector kỳ vọng µ và ma trận hiệp phương
sai Σ, hàm mật độ cho bởi:
g(y)=
1
(
√
2π)
p
|Σ|
1/2
e
−(y−µ)
Σ
−1
(y−µ)/2
, (1.3.2)
với p là số biến. Khi y có hàm mật độ (1.3.2), ta nói y có phân phối chuẩn nhiều chiều
N
p
(µ, Σ) .
Số hạng (y −µ)
2
/σ
2
=(y −µ)(σ
2
)
−1
(y −µ) trong số mũ của hàm mật độ chuẩn một chiều,
đo bình phương khoảng cách từ y đến µ trên đơn vò độ lệch tiêu chuẩn. Tương tự, số hạng
(y −µ)
Σ
−1
(y −µ) trong số mũ của hàm mật độ chuẩn nhiều chiều (1.3.2) là bình phương
khoảng cách tổng quát từ y đến µ, hay còn gọi là khoảng cách Mahalanobis.
Trong (1.3.2), |Σ|
1/2
xuất hiện tương tự như
√
σ
2
trong (1.3.1).
1.3.1.3 Phương sai tổng quát
Chúng ta đònh nghóa phương sai mẫu tổng quát là đònh thức của ma trận hiệp phương
sai: |S|. Tương tự, |Σ| là phương sai phân phối tổng quát. Nếu σ
2
nhỏ trong chuẩn một
chiều, thì các giá trò của y tập trung gần trung bình. Tương tự, giá trò của |Σ| nhỏ trong
trường hợp nhiều chiều chỉ ra rằng các giá trò y tập trung gần µ trong không gian p chiều
hay có đa cộng tuyến giữa các biến (các biến có tương quan cao), trong trường hợp này số
Chương I: Kiến thức Đại số và Xác suất Thông kê 21 Luận văn thạc só toán học
chiều có ảnh hưởng thấp hơn p. Trong trường hợp đa cộng tuyến, một hoặc nhiều giá trò
riêng của Σ sẽ gần 0 và |Σ| sẽ nhỏ, vì |Σ| là tích của các giá trò riêng.
1.3.1.4 Tính đa dạng của các ứng dụng chuẩn nhiều chiều
Việc sử dụng rộng rãi chuẩn nhiều chiều là do tính dễ dùng. Từ giả đònh chuẩn nhiều
chiều, một loạt các thủ tục được thiết lập và có sẳn trong các gói phần mềm. Việc thay thế
chuẩn nhiều chiều là khá ít so với trong trường hợp một chiều. Bởi vì không đơn giản để
sắp xếp các vector quan trắc nhiều chiều như trong quan trắc một chiều, không có nhiều
thủ tục phi tham số thích hợp cho dữ liệu nhiều chiều.
Mặc dù dữ liệu thực tế thường không chính xác với chuẩn nhiều chiều, chuẩn nhiều
chiều cung cấp một xấp xỉ hữu ích cho phân phối thực sự.
1.3.2 Các tính chất của biến ngẫu nhiên có phân phối chuẩn nhiều chiều
Các tính chất của một vector ngẫu nhiên y (p × 1) có phân phối chuẩn nhiều chiều
N
p
(µ, Σ) là:
1. Chuẩn của tổ hợp tuyến tính các biến trong y:
(a) Nếu a là một vector hằng, hàm tuyến tính a
y = a
1
y
1
+ a
2
y
2
+ + a
p
y
p
có phân phối
chuẩn một chiều:
Nếu y ∼ N
p
(µ, Σ), thì a
y ∼ N(a
µ, a
Σa).
(b) Nếu A là ma trận hằng q × p hạng q, với q ≤ p, thì q tổ hợp tuyến tính trong Ay có
phân phối chuẩn nhiều chiều:
Nếu y ∼ N
p
(µ, Σ), thì Ay ∼ N
q
(Aµ, AΣA
).
2. Biến tiêu chuẩn hóa:
Một vector tiêu chuẩn hóa z có được theo hai cách:
z =(T
)
−1
(y −µ), (1.3.3)
với Σ = T
T có được bằng cách sử dụng thuật toán Cholesky trong phần (1.1.1), hoặc
z =(Σ
1/2
)
−1
(y − µ), (1.3.4)
với Σ
1/2
là ma trận căn bậc hai đối xứng của Σ (đònh nghóa trong (1.1.11)).
Lúc đó, z sẽ có phân phối chuẩn nhiều chiều:
Chương I: Kiến thức Đại số và Xác suất Thông kê 22 Luận văn thạc só toán học
Nếu y ∼ N
p
(µ, Σ), thì z ∼ N
p
(0, I).
3. Phân phối Chi bình phương:
Một biến ngẫu nhiên có phân phối chi bình phương với p bậc tự do được đònh nghóa là
tổng bình phương p biến ngẫu nhiên chuẩn, độc lập, tiêu chuẩn hóa. Do đó, nếu z là vector
tiêu chuẩn hóa được đònh nghóa trong (1.3.3) hoặc (1.3.4), thì
p
j=1
z
2
j
= z
z có phân phối χ
2
với p bậc tự do, đònh nghóa là χ
2
p
hoặc χ
2
(p).
Từ (1.3.3) hoặc (1.3.4) ta có: z
z =(y −µ)
Σ
−1
(y − µ). Do đó,
Nếu y ∼ N
p
(µ, Σ), thì (y −µ)
Σ
−1
(y −µ) ∼ χ
2
p
. (1.3.5)
4. Chuẩn của phân phối biên duyên:
(a) Bất kỳ tập con của y có phân phối chuẩn nhiều chiều. Chẳng hạn, đặt y
1
=(y
1
,y
2
, ,y
r
)
là vector con chứa r phần tử đầu tiên của y và y
2
=(y
r+1
, ,y
p
)
chứa p −r phần tử còn
lại. Ta có, y, µ và Σ được chia nhỏ thành:
y =
y
1
y
2
, µ =
µ
1
µ
2
, Σ =
Σ
11
Σ
12
Σ
21
Σ
22
,
với y
1
và µ
1
là r x 1 và Σ
11
là r x r. Lúc đó y
1
có phân phối chuẩn nhiều chiều:
Nếu y ∼ N
p
(µ, Σ), thì y
1
∼ N
r
(µ
1
, Σ
11
).
(b) Trường hợp đặc biệt, mỗi y
j
trong y có phân phối chuẩn một chiều:
Nếu y ∼ N
p
(µ, Σ), thì y
j
∼ N(µ
j
,σ
jj
),j =1, 2, ,p.
Chiều ngược lại không đúng. Nếu hàm mật độ của mỗi y
i
trong y là chuẩn, không nhất
thiết y là chuẩn nhiều chiều.
Trong ba tính chất tiếp theo, đặt vector quan trắc được tách thành hai vector con là y
và x, với y là p × 1 và x là q × 1. Ta có:
E
y
x
=
µ
y
µ
x
, cov
y
x
=
Σ
yy
Σ
yx
Σ
xy
Σ
xx
.
Trong tính chất 5, 6, 7 sau đây, ta giả sử rằng:
y
x
∼ N
p+q
µ
y
µ
x
,
Σ
yy
Σ
yx
Σ
xy
Σ
xx
5. Tính độc lập:
(a) Vector con y và x là độc lập nếu Σ
yx
= 0 .
(b) Hai biến thành phần y
j
và y
k
là độc lập nếu σ
jk
=0. Lưu ý điều này không đúng cho
các biến ngẫu nhiên không chuẩn, như trong phần (1.2.2.1).
Chương I: Kiến thức Đại số và Xác suất Thông kê 23 Luận văn thạc só toán học
6. Phân phối có điều kiện:
Nếu y và x không độc lập, thì Σ
yx
= 0, và phân phối có điều kiện của y cho trước x,
f(y|x ), là chuẩn nhiều chiều với:
E(y|x)=µ
y
+ Σ
yx
Σ
−1
xx
(x − µ
x
), (1.3.6)
cov(y|x)=Σ
yy
− Σ
yx
Σ
−1
xx
Σ
xy
. (1.3.7)
Lưu ý, E(y|x) là một vector của các hàm tuyến tính của x, trong khi cov(y|x) là một ma
trận không phụ thuộc x. Ma trận Σ
yx
Σ
−1
xx
trong (1.3.6) được gọi là ma trận các hệ số hồi
qui vì nó qui E(y|x) về x.
Ta mô tả tính chất (6) trong trường hợp chuẩn hai chiều:
Đặt u =
y
x
có phân phối chuẩn hai chiều với:
E(u)=
µ
y
µ
x
, cov(u)=Σ =
σ
2
y
σ
yx
σ
yx
σ
2
x
.
Đònh nghóa f(y|x)=g(y, x)/h(x), với h(x) là hàm mật độ của x và g(y, x) là hàm mật độ
đồng thời của y và x. Ta có:
g(y, x)=f(y|x)h(x),
vì vế phải là tích, ta tìm một hàm của y và x độc lập với x và hàm mật độ của nó giống
f(y|x). Vì hàm tuyến tính của y và x là chuẩn (theo tính chất 1a), ta xem xét y − βx và
tìm kiếm giá trò β để y − βx và x là độc lập.
Vì z = y − βx và x là chuẩn nên để z và x là độc lập, ta phải có cov(x, z)=0. Để tìm
cov(x, z), ta biểu diễn x và z là các hàm của u:
x =(0, 1)
y
x
=(0, 1)u = a
u,
z = y − βx =(1, −β)u = b
u.
Lúc đó,
cov(x, z)=cov(a
u, b
u)
= a
Σb (theo 1.2.45)
=(0, 1)
σ
2
y
σ
yx
σ
yx
σ
2
x
1
−β
=(σ
yx
,σ
2
x
)
1
−β
= σ
yx
− βσ
2
x
.
Để cov(x, z)=0, thì β = σ
yx
/σ
2
x
, và z = y −βx trở thành
Chương I: Kiến thức Đại số và Xác suất Thông kê 24 Luận văn thạc só toán học
z = y −
σ
yx
σ
2
x
x.
Theo tính chất 1a, hàm mật độ của y −(σ
yx
/σ
2
x
)x là chuẩn với
E
y −
σ
yx
σ
2
x
x
= µ
y
−
σ
yx
σ
2
x
µ
x
,
var
y −
σ
yx
σ
2
x
x
= var(b
u)=b
Σb
=
1, −
σ
yx
σ
2
x
σ
2
y
σ
yx
σ
yx
σ
2
x
1
−
σ
yx
σ
2
x
= σ
2
y
−
σ
yx
σ
2
x
.
Với x cho trước, ta có thể biểu diễn y = βx+(y −βx), với βx là một con số cố đònh tương
ứng giá trò cho trước x và y − βx là độ lệch ngẫu nhiên. Lúc đó, f(y|x) là chuẩn, với:
E(y|x)=βx + E(y − βx)=βx + µ
y
− βµ
x
= µ
y
+ β(x − µ
x
)=µ
y
+
σ
yx
σ
2
x
(x − µ
x
),
var(y|x)=σ
2
y
−
σ
2
yx
σ
2
x
.
7. Phân phối của tổng hai vector con:
Nếu y và x cùng kích cỡ (p x 1) và độc lập thì,
y + x ∼ N
p
(µ
y
+ µ
x
, Σ
yy
+ Σ
xx
), (1.3.8)
y −x ∼ N
p
(µ
y
−µ
x
, Σ
yy
+ Σ
xx
), (1.3.9)
1.3.3 Ước lượng trong chuẩn nhiều chiều
1.3.3.1 Ước lượng hợp lý cực đại
Trong phân phối chuẩn nhiều chiều, phương pháp hợp lý cực đại thường được dùng để
ước lượng tham số. Kỹ thuật này là: với các vector quan trắc y
1
, y
2
, ,y
n
cho trước, tìm
các giá trò của µ và Σ để cực đại hàm mật độ đồng thời các giá trò của y, gọi là hàm hợp
lý. Đối với chuẩn nhiều chiều, ước lượng hợp lý cực đại của µ và Σ là:
ˆ
µ =
y, (1.3.10)
ˆ
Σ =
1
n
n
i=1
(y
i
− y)(y
i
−y)
=
1
n
W
=
n −1
n
S, (1.3.11)