Tải bản đầy đủ (.pdf) (79 trang)

Ứng dụng mô hình logistic trong xếp hạng tín dụng doanh nghiệp

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (717.98 KB, 79 trang )

TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
KHOA TOÁN

======

LÊ THỊ PHƯƠNG

ỨNG DỤNG MÔ HÌNH LOGISTIC
TRONG XẾP HẠNG TÍN DỤNG
DOANH NGHIỆP

KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC
Chuyên ngành: Toán ứng dụng

HÀ NỘI - 2019


TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
KHOA TOÁN

======

LÊ THỊ PHƯƠNG

ỨNG DỤNG MÔ HÌNH LOGISTIC
TRONG XẾP HẠNG TÍN DỤNG
DOANH NGHIỆP
KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC
Chuyên ngành: Toán ứng dụng
Người hướng dẫn khoa học


PGS.TS. TRẦN TRỌNG NGUYÊN

HÀ NỘI - 2019


LỜI CẢM ƠN
Trong quá trình học tập, nghiên cứu và hoàn thành khóa luận “Ứng
dụng mô hình logistic trong xếp hạng tín dụng doanh nghiệp” em đã nhận
được sự hướng dẫn, giúp đỡ và động viên của nhiều cá nhân và tập thể, em
xin được bày tỏ lòng biết ơn sâu sắc nhất tới tất cả các cá nhân và tập thể đã
tạo điều kiện giúp đỡ em.
Trước hết, em xin bày tỏ lòng biết ơn chân thành tới các thầy cô giáo
khoa Toán – Trường Đại học Sư phạm Hà Nội 2 đã đem lại cho em những
kiến thức bổ trợ, vô cùng có ích trong những năm học vừa qua.
Em xin gửi lời cảm ơn chân thành và sự tri ân sâu sắc đến PGS.TS.
Trần Trọng Nguyên – người thầy đã trực tiếp hướng dẫn, tận tình chỉ bảo,
giúp đỡ em trong quá trình nghiên cứu và hoàn thiện khóa luận này.
Cuối cùng em xin gửi lời cảm ơn đến gia đình, bạn bè, những người
đã luôn bên em, động viên và khuyến khích em trong quá trình thực hiện đề
tài nghiên cứu của mình.
Trong quá trình nghiên cứu, do năng lực bản thân còn hạn chế nên
khóa luận không tránh khỏi những thiếu sót nhất định. Em kính mong nhận
được sự đóng góp ý kiến của các thầy giáo, cô giáo và toàn thể bạn đọc để
khóa luận được hoàn thiện hơn.
Em xin chân thành cảm ơn!
Hà Nội, tháng 5 năm 2019
Sinh viên

Lê Thị Phương



LỜI CAM ĐOAN
Em xin cam đoan đây là bài của em, được hoàn thành dưới sự hướng dẫn
của PGS.TS. Trần Trọng Nguyên. Các nội dung nghiên cứu trong khóa luận
là hoàn toàn trung thực, mọi thông tin trích dẫn đều được ghi rõ nguồn gốc
trong mục tài liệu tham khảo.
Nếu phát hiện có bất kỳ gian lận nào, em xin chịu hoàn toàn trách
nhiệm.
Hà Nội, tháng 5 năm 2019
Sinh viên

Lê Thị Phương


DANH MỤC CÁC TỪ VIẾT TẮT

DN

Doanh nghiệp

KH

Khách hàng

MLE

Phương pháp hợp lý cực đại

NHTM


Ngân hàng thương mại

OLS

Phương pháp bình phương nhỏ nhất

TSCĐ

Tài sản cố định

XHTD

Xếp hạng tín dụng


MỤC LỤC
LỜI MỞ ĐẦU ................................................................................................ 1
1. Lý do chọn đề tài ........................................................................................ 1
2. Mục tiêu nghiên cứu chuyên đề .................................................................. 1
3. Đối tượng và phạm vi nghiên cứu chuyên đề .............................................. 2
4. Phương pháp nghiên cứu ............................................................................ 2
5. Nội dung nghiên cứu .................................................................................. 2
CHƯƠNG 1: CƠ SỞ LÝ THUYẾT VỀ XẾP HẠNG TÍN DỤNG
DOANH NGHIỆP VÀ MÔ HÌNH HỒI QUY ................................................ 3
1.1. Kiến thức chuẩn bị .................................................................................. 3
1.1.1. Một số kiến thức về xác suất................................................................. 3
1.1.2. Biến ngẫu nhiên và các đặc trưng ......................................................... 4
1.1.2.1. Biến ngẫu nhiên ................................................................................. 4
1.1.2.2. Hàm phân phối xác suất của biến ngẫu nhiên..................................... 4
1.1.2.3. Các số đặc trưng ................................................................................ 5

1.1.2.4. Một số phân phối xác suất quan trọng ................................................ 6
1.2. Một số kiến thức về thống kê ................................................................. 10
1.2.1. Mẫu ngẫu nhiên, hàm phân phối mẫu và các số đặc trưng mẫu........... 10
1.2.2. Ước lượng tham số của phân phối ...................................................... 12
1.2.2.1. Phương pháp hợp lý cực đại ............................................................ 12
1.2.2.2. Phương pháp Mômen....................................................................... 14
1.2.3. Kiểm định giả thuyết .......................................................................... 14
1.2.4. Hồi Quy .............................................................................................. 15
1.2.4.1. Định nghĩa ....................................................................................... 15
1.2.4.2. Các phương pháp ước lượng cơ bản................................................. 16
1.3. Tín dụng và vai trò của tín dụng ............................................................ 18


1.3.1. Khái niệm và phân loại tín dụng ......................................................... 18
1.3.1.1. Khái niệm tín dụng .......................................................................... 18
1.3.1.2. Phân loại tín dụng ............................................................................ 19
1.3.2. Vai trò của tín dụng ............................................................................ 21
1.3.2.1. Vai trò của tín dụng đối với các ngân hàng ...................................... 21
1.3.2.2. Vai trò của tín dụng đối với khách hàng doanh nghiệp .................... 21
1.3.2.3. Vai trò điều chỉnh các hoạt động của nền kinh tế ............................ 21
1.4. Rủi ro tín dụng ...................................................................................... 22
1.4.1. Khái niệm rủi ro tín dụng ................................................................... 22
1.4.2. Các hình thức rủi ro tín dụng ............................................................. 22
1.5. Xếp hạng tín dụng và các phương pháp đánh giá xếp hạng tín dụng ...... 23
1.5.1. Xếp hạng tín dụng .............................................................................. 23
1.5.1.1. Khái niệm ........................................................................................ 23
1.5.1.2. Nguyên tắc xếp hạng ...................................................................... 24
1.5.2. Các phương pháp xếp hạng tín dụng doanh nghiệp điển hình ............. 29
1.5.2.1. Phương pháp chuyên gia .................................................................. 29
1.5.2.2. Mô hình toán học xếp hạng tín dụng doanh nghiệp ......................... 31

CHƯƠNG 2: ỨNG DỤNG MÔ HÌNH LOGISTIC TRONG XẾP HẠNG
TÍN DỤNG DOANH NGHIỆP. ................................................................... 35
2.1. Mô hình Logit (hồi quy Binary Logistic) ............................................... 35
2.2. Chọn biến cho mô hình .......................................................................... 37
2.3. Xây dựng mô hình xếp hạng Doanh nghiệp ........................................... 42
2.4. Một số giải pháp nhằm phòng ngừa và hạn chế rủi ro tín dụng .............. 63
2.4.1. Một số giải pháp ................................................................................. 63
2.4.1.1. Đào tạo nâng cao chất lượng đội ngũ tín dụng ................................. 63
2.4.1.2. Đánh giá tình hình hoặt động doanh nghiệp ..................................... 63


2.4.1.3. Mua bán nợ và các tài sản phái sinh ................................................. 64
2.4.2. Một số kiến nghị ................................................................................. 65
KẾT LUẬN .................................................................................................. 67
TÀI LIỆU THAM KHẢO ............................................................................ 69


DANH MỤC BẢNG BIỂU
Bảng 1.1. Xếp hạng tín dụng sử dụng cho nợ ngắn hạn ................................ 26
Bảng 1.2. Xếp hạng tín dụng sử dụng cho nợ trung và dài hạn ..................... 27
Bảng 1.3. Bảng chuẩn xếp hạng tín dụng của CIC ........................................ 28
Bảng 2.1. Ma trận hệ số tương quan giữa các biến ....................................... 41
Bảng 2.2. Bảng mô tả thống kê mẫu nghiên cứu........................................... 42
Bảng 2.3. Mô hình hồi quy Logistic với đầy đủ các biến số ......................... 43
Bảng 2.4. Kiểm định Wald – Test đối với biến X7 ....................................... 45
Bảng 2.5. Kiểm định Wald – Test đối với biến X8 ....................................... 46
Bảng 2.6. Kiểm định Wald – Test đối với biến X14 ..................................... 47
Bảng 2.7. Mô hình hồi quy Logistic với các biến X1, X2, X3, X4, X5,
X6, X9, X10, X11, X12, X13, X15............................................... 48
Bảng 2.8. Kiểm định Wald – Test đối với biến X12 ..................................... 49

Bảng 2.9. Kiểm định Wald – Test đối với biến X5 ....................................... 50
Bảng 2.10. Mô hình hồi quy Logistic với các biến X1, X2, X3, X4, X6,
X9, X10, X11, X13, X15 .............................................................. 51
Bảng 2.11. Kiểm định Wald – Test đối với biến X6 ..................................... 52
Bảng 2.12. Kiểm định Wald – Test đối với biến X15 ................................... 53
Bảng 2.13. Mô hình hồi quy Logistic với các biến X1, X2, X3, X4, X9,
X10, X11, X13 ............................................................................. 54
Bảng 2.14. Kiểm định Wald – Test đối với biến X2 ..................................... 55
Bảng 2.15. Kiểm định Wald – Test đối với biến X3 ..................................... 56
Bảng 2.16. Kiểm định Wald – Test đối với biến X4 ..................................... 57
Bảng 2.17. Kiểm định Wald – Test đối với biến X13 ................................... 58
Bảng 2.18. Mô hình hồi quy Logistic với các biến X1, X9, X10, X11 .......... 58
Bảng 2.19. Bảng tần số các giá trị của biến phụ thuộc .................................. 60


Bảng 2.20. Kiểm tra tỷ lệ dự báo .................................................................. 60
Bảng 2.21. Bảng kết quả xác suất nợ không đủ tiêu chuẩn và xếp hạng
50 doanh nghiệp ........................................................................... 62


LỜI MỞ ĐẦU
1. Lý do chọn đề tài
Thực tế cho thấy, những doanh nghiệp hoạt động tốt, được đánh giá cho
khả năng hoạt động từ mức an toàn trở lên mới được sử dụng các nguồn lực
xã hội để tổ chức sản xuất và kinh doanh.Với tiềm lực kinh tế còn hạn chế của
một nước đang phát triển như Việt Nam, những doanh nghiệp còn yếu kém,
dễ gây lãng phí và thất thoát cho nền kinh tế và hơn nữa có thể kéo lùi tốc độ
tăng trưởng thì không thể sử dụng tốt các nguồn lực xã hội. Chính vì vậy mà
nền kinh tế trong quá trình phát triển luôn có những phương pháp để đánh giá
các doanh nghiệp trong việc cung cấp các nguồn lực xã hội như cho vay và

đầu tư được hình thành trong đó có phương pháp xếp hạng tín dụng. Xếp
hạng tín dụng ngày nay đã trở thành tiêu chí hàng đầu được sử dụng để đánh
giá không chỉ các doanh nghiệp sản xuất, các định chế tài chính mà cho cả
nền kinh tế nói chung.
Các doanh nghiệp hiện nay sử dụng xếp hạng tín nhiệm nhằm biết rõ
tình trạng hoạt động kinh doanh thực tế của mình, triển vọng phát triển trong
tương lai, cũng như những rủi ro có thể gặp phải. Trên cơ sở đó đề ra các kế
hoạch điều chỉnh chiến lược trong hoạt động kinh doanh nhằm nâng cao hiệu
quả hay khả năng cạnh tranh. Trong trường hợp doanh nghiệp phát hành cổ
phiếu ra công chúng chúng lần đầu, cổ phần hóa thì kết quả của xếp hạng tín
nhiệm là cơ sở để xây dựng giá trị của doanh nghiệp và giá trị của mỗi cổ
phần phát hành. Đồng thời, xếp hạng tín nhiệm là cơ sở cho phép các doanh
nghiệp so sánh vị thế cạnh tranh của mình và các doanh nghiệp khác. Vì vậy
em quyết định lựa chọn đề tài: “Ứng dụng mô hình logistic trong xếp hạng
tín dụng doanh nghiệp”.
Do thời gian và năng lực nghiên cứu của bản thân còn hạn chế nên
khóa luận không tránh khỏi thiếu sót. Em rất mong được sự góp ý của các
thầy cô và các bạn.
2. Mục tiêu nghiên cứu chuyên đề
 Mục tiêu chung
+ Đề tài tiếp cận các lý thuyết về xếp hạng tín dụng, mô hình hồi quy
Logistic, từ đó ứng dụng mô hình Logistic để xếp hạng tín dụng các

1


doanh nghiệp.
 Mục tiêu cụ thể
+ Hệ thống hóa lý thuyết về xếp hạng tín dụng;
+ Tìm hiểu về mô hình Logistic;

+ Tìm hiểu, lựa chọn các chỉ số tài chính thích hợp và ứng dụng mô hình
Logistic trong xếp hạng tín dụng doanh nghiệp;
+ Tính toán được xác suất rủi ro tín dụng của doanh nghiệp từ đó đưa ra
khuyến nghị về tình hình rủi ro của một số doanh nghiệp.
3. Đối tượng và phạm vi nghiên cứu chuyên đề
+ Đối tượng nghiên cứu: Mô hình Logistic xếp hạng tín dụng các doanh
nghiệp.
+ Phạm vi nghiên cứu
- Phạm vi không gian: Một số doanh nghiệp đang niên yết trên thị trường
chứng khoán hiện nay;
- Phạm vi thời gian: Số liệu trong những năm gần đây.
4. Phương pháp nghiên cứu
Các phương pháp được sử dụng trong bài nghiên cứu
+ Phương pháp thu thập số liệu;
+ Phương pháp thống kê mô tả thống kê mô tả mẫu, tìm hiểu đặc điểm
của đối tượng nghiên cứu;
+ Phương pháp so sánh, phân tích quy trình xếp hạng tín dụng của các tổ
chức xếp hạng tín dụng;
+ Phương pháp định lượng: Ứng dụng mô hình Logistic.
5. Nội dung nghiên cứu
Chương 1: Cơ sở lý thuyết về xếp hạng tín dụng doang nghiệp và mô
hình hồi quy.
Chương 2: Ứng dụng mô hình Logistic trong xếp hạng tín dụng doanh
nghiệp.

2


CHƯƠNG 1: CƠ SỞ LÝ THUYẾT VỀ XẾP HẠNG TÍN DỤNG
DOANH NGHIỆP VÀ MÔ HÌNH HỒI QUY

1.1. Kiến thức chuẩn bị
1.1.1. Một số kiến thức về xác suất
* Không gian mẫu, biến cố và xác suất
Không gian mẫu Ω của một thí nghiệm hay một phép thử ngẫu nhiên là
tập hợp tất cả các kết quả có thể xảy ra. Ví dụ khi tung một con xúc sắc sáu
mặt thì không gian mẫu là 1, 2, 3, 4, 5, 6 .
Tập con A bất kì của không gian mẫu được gọi là một biến cố. Khi tập
con A của không gian mẫu chỉ chứa một phần tử thì được gọi là biến cố cơ
bản.
Định nghĩa 1.1.1. (Định nghĩa xác suất)
Cho Ω là một tập khác rỗng và họ Ƒ là σ – đại số các tập con của tập Ω.
Hàm tập ℙ: Ƒ →ℝ thỏa mãn điều kiện
A    A

1) Với mọi A∈ Ƒ thì 0≤ ℙ(A)≤1;
2) ℙ(Ω) = 1;








3) A1,A2,…∈ Ƒ và Ai∩Aj≠∅, với mọi i≠j thì   Ai    ( Ai ).
 i 1 

i 1

Khi đó ℙ(A) được gọi là xác suất của biến cố A.

Bộ ba (Ω, Ƒ, ℙ) được gọi là không gian xác suất tổng quát.
Tính chất
1) ℙ(∅) = 0, ℙ(Ω) = 1;
2) Đối với hai biến cố A, B bất kì, ta có
ℙ(A∪B) = ℙ(A) + ℙ(B) - ℙ(A∩B);
3)   A   1    A  ;
4) Đối với họ không quá đếm được các biến cố bất kì  Ai : i  I  ta có bất

3


đẳng thức Boole sau

 

  Ai    ( Ai );
I

I

Đặc biệt nếu các Ai đôi một xung khắc (hay xung khắc từng cặp), nghĩa là
Ai Aj  (i  j ) thì

 

  Ai    ( Ai ).
I

I


Định nghĩa 1.1.2. (Xác suất có điều kiện)
Cho không gian xác suất (Ω, Ƒ, ℙ) và A, B ∈ Ƒ . Nếu ℙ(A)>0 thì tỷ số
 A  B
   B A  là xác suất điều kiện của biến cố B với điều kiện biến cố A
  A

đã xảy ra. Tương tự, nếu ℙ(B)>0 thì tỉ số

 A  B
   B A  là xác suất điều
  A

kiện của biến cố A với điều kiện biến cố B đã xảy ra.
1.1.2. Biến ngẫu nhiên và các đặc trưng
1.1.2.1. Biến ngẫu nhiên
Định nghĩa 1.1.3. (Biến ngẫu nhiên)
Cho không gian xác suất (Ω, Ƒ, ℙ). Hàm X: Ω→ℝ được gọi là một biến ngẫu
nhiên hay hàm đo được nếu X 1 (B) ∈ Ƒ, với mọi B ∈ ß(ℝ) ở đó ß(ℝ) là σ – đại
số các tập Borel trên ℝ.
Biến ngẫu nhiên X được gọi là


Biến ngẫu nhiên rời rạc nếu X chỉ nhận hữu hạn hay đếm được các

giá trị;


Biến ngẫu nhiên liên tục nếu X nhận giá trị lấp đầy khoảng (a, b)   .

1.1.2.2. Hàm phân phối xác suất của biến ngẫu nhiên

Định nghĩa 1.1.4. (Hàm phân phối xác suất của biến ngẫu nhiên)
Giả sử X là biến ngẫu nhiên xác định trên không gian xác suất (Ω, Ƒ, ℙ)
và nhận giá trị trong không gian (ℝ,ß).
Với B∈ß thì ℙX(B) =   w:X(w )  ß  được gọi là phân phối xác suất của

4


biến ngẫu nhiên X.
Nếu lấy B = (-∞,x), x∈ℝ thì ℙX((-∞,x)) =   w:X(w )  x  được gọi là hàm
phân phối xác suất của biến ngẫu nhiên X và kí hiệu là
FX(x) =   w:X(w )  x  , x∈ℝ.
Tính chất
1) Hàm phân phối xác suất F(x) là hàm đơn điệu không giảm, nghĩa là
với x12) Hàm phân phối F(x) là hàm liên tục trái, nghĩa là
lim F ( x )  F ( a ) , a∈ℝ;

x a 

3) lim FX ( x )  0, lim FX ( x )  1;
x 
x 
b

4) ℙ(a≤X≤b) = FX(b) – FX(a) =



f X ( x )d ( x ) . Với f X ( x) 


a

dFX ( x)
là hàm
dx

mật độ của biến ngẫu nhiên liên tục X;
5) Nếu X là biến ngẫu nhiên rời rạc thì
ℙ(X∈B) =

   X  x .
i

i:xi B

1.1.2.3. Các số đặc trưng


Kỳ vọng

Định nghĩa 1.1.5. (Kỳ vọng của biến ngẫu nhiên)
+ Kỳ vọng của biến ngẫu nhiên rời rạc được xác định bởi công thức
E(X) =

 a ( X  a ) với ai là các giá trị của X.
i

i


i

+ Kỳ vọng của biến ngẫu nhiên liên tục X có hàm mật độ được xác định bởi
công thức


E( X ) 

 xf ( x)dx.



Từ định nghĩa ta thấy rằng E(X) là hoàn toàn xác định, không phụ thuộc vào
cách biểu diễn của X và như vậy kỳ vọng là một phiếm hàm xác định trên 10 .

5


Tính chất
1) E(c) = c với c là hằng số;
2) E(.) là một phiếm hàm tuyến tính trên 10 , nghĩa là
E(aX+bY) = aE(X) + bE(Y), với mọi a,b∈ℝ;
3) X≥0 suy ra E(X)≥0, X≤Y suy ra E(X)≤E(Y);
4) E(IA) = ℙ(A),A∈ Ƒ;
5) Nếu X, Y là hai biến ngẫu nhiên độc lập và X, Y∈ 1 , nghĩa là
E(X), E(Y) <∞ thì E(XY) = E(X)E(Y).


Phương sai


Định nghĩa 1.1.6. (Phương sai của biến ngẫu nhiên)
Phương sai của biến ngẫu nhiên X kí hiệu là D(X) và được tính bằng
công thức
D(X) = E(X – EX)2 = EX2 – (EX)2.
Tính chất
1) D(c) = 0, với c là hằng số bất kì;
2) D(aX+b) = a2D(X) với a, b là hằng số bất kì;
3) Nếu X, Y là hai biến ngẫu nhiên độc lập thì D(X+Y) = D(X) + D(Y).


Kỳ vọng có điều kiện

Định nghĩa 1.1.7. (Kỳ vọng có điều kiện)
Giả sử X là biến ngẫu nhiên khả tích xác định trên không xác suất (Ω, Ƒ, ℙ).
Giả sử G là σ – đại số con của Ƒ. Khi đó tồn tại một biến ngẫu nhiên suy rộng,
không âm, kí hiệu E(X/G) thỏa mãn các điều kiện
+ E(X/G) là G - đo được;
+ Với mọi A ∈ Ƒ ta có  Xd    E (X/G)dℙ.
A

A

Khi đó E(X/G) được gọi kỳ vọng có điều kiện của X đối với G.
1.1.2.4. Một số phân phối xác suất quan trọng


Phân phối nhị thức

Định nghĩa 1.1.8. Biến ngẫu nhiên rời rạc X có phân phối nhị thức, với các


6


tham số n và p (n nguyên dương và 0ℙ ( X  k )  Cnk p k (1  p)n k .
Ký hiệu X~B(n;p) phân phối B(1;p) còn được gọi là Phân phối Bernoulli
với tham số p.
Ký hiệu X~B(p) và ℙ(X = 0) = 1 – p và ℙ(X = 1) = p.
Tính chất
1) Nếu X~B(n;p) thì E(X) = np và D(X) = np(1 – p);
2) Cho hai biến ngẫu nhiên X và Y độc lập. Nếu X ~ B(n;p) và
Y ~ B(m;p) thì biến ngẫu nhiên Z = X+Y ~ B(n+m;p);
3) Nếu các biến ngẫu nhiên X1 , X 2 ,, X n độc lập, cùng có phân phối
B(p), thì biến ngẫu nhiên X  X1  X 2  ...  X n có phân phối B(n;p).


Phân phối Poisson

Định nghĩa 1.1.9. Biến ngẫu nhiên rời rạc X được gọi là có phân phối Poisson
với tham số λ>0 nếu phân phối xác suất của nó có dạng
 k e 
ℙ (X  k) 
k!

k = 0,1,...

Kí hiệu X ~ Poi(λ).
Tính chất
1) E(X) = D(X) = λ;
2) Nếu hai biến ngẫu nhiên X1 và X2 độc lập, X1 ~ Poi(λ1) và X2 ~ Poi(λ2)

thì biến ngẫu nhiên X1+X2 ~ Poi(λ1+ λ2);
Tổng quát: Nếu dãy biến ngẫu nhiên độc lập Xi, i= 1,2,… và Xi ~ Poi(λi)
n

thì

n

X
i 1



i

 Poi ( i ).
i 1

Phân phối chuẩn

Định nghĩa 1.1.10. Biến ngẫu nhiên X được gọi là có phân phối chuẩn (hay
phân phối Gauss) với các tham số μ, σ 2(σ >0) nếu hàm mật độ của nó có dạng

7



1
f ( x) 
e

 2

 x   2
2 2

, x∈ℝ.

Kí hiệu X~N(μ,σ2).
Trường hợp μ = 0, σ = 1. Phân phối N(0,1) được gọi là phân phối chuẩn
hóa. Khi đó hàm mật độ của X có dạng
1 2x
f ( x) 
e
2

2

, x∈ℝ.

Và hàm phân phối tương ứng
1
∅(x) =
2

x

e

u 2
2


du , x∈ℝ.



Tính chất
1) E(X) = μ; D(X) =σ2;
2) Nếu X~N(μ,σ2) và a, b là các số thực thì aX + b ~ N(aμ + b,(aσ)2).
Do đó ta có thể quy mọi biến ngẫu nhiên phân phối chuẩn về dạng phân phối
chuẩn hóa và ngược lại;
+ Nếu X~N(μ,σ2) thì Z~

X 
là một biến có phân phối chuẩn hóa


Z~N(0,1);
+ Nếu Z~N(0,1) thì X = σZ + μ là một biến ngẫu nhiên có phân phối
chuẩn với giá trị trung bình μ và phương sai σ2 X~N(μ,σ2).
3) Nếu X~ N   X ,  X 2  và Y~ N (Y ,  Y 2 ) là các biến ngẫu nhiên độc
lập, thì
+ Tổng của chúng là có phân phối chuẩn với
U = X +Y~ N   X  Y ,  X 2   Y 2  ;
+ Hiệu của chúng là có phân phối chuẩn với
U = X - Y~ N   X – Y ,  X 2   Y 2  ;
+ U và V là độc lập với nhau.

8



 Phân phối logistic
+ Phân phối logistic tiêu chuẩn
Định nghĩa 1.1.11. Biến ngẫu nhiên liên tục X được gọi là có phân phối
logistic tiêu chuẩn nếu hàm mật độ xác suất của nó có dạng
ex
f ( x) 
, x  ℝ.
(1  e x )2

Tính chất
1) f đối xứng qua x = 0;
2) f tăng trên (-∞,0), giảm trên (0,+∞) do đó E  X  = 0, D  X  =

2
;
3

3) Hàm phân phối xác suất X có dạng
F ( x) 

ex
, x∈ℝ;
1 ex

4) Hàm sinh moomen
M t 

= β(1 + t, 1 – t) = ᴦ(1 + t)ᴦ(1 – t)

(-1< t < 1);


Trong đó
Hàm Gamma


ᴦ(a) =

x

a 1  x

e dx , với a>0;

0

Hàm Bêta
1

β(a,b) =  xa1 (1  x)b1 dx , a>0, b>0;
0

 p 
p
 , p  (0,1),
1 p
 1 p 

5) Hàm phân phối xác suất nghịch đảo F 1 ( p)  ln 

được gọi là tỷ lệ có lợi cho một sự kiện với xác suất xảy ra là p. Do đó phân

phối logistic có tính chất quan trọng là hàm phân phối xác suất nghịch đảo là
logarit của tỷ lệ cược tương ứng. Hàm này của p đôi khi được gọi là hàm
logit.
+ Phân phối logistic tổng quát
Phân phối logistic tổng quát được xây dựng dựa trên phân phối logistic
tiêu chuẩn. Giả sử Z là biến ngẫu nhiên có phân phối logistic chuẩn, cho a∈ℝ
và b∈(0,+∞), cho X = a + bZ là phân phối logistic có tham số vị trí là a tham

9


số quy mô là b. Do đó các kết quả của phân phối logistic tiêu chuẩn sẽ được
áp dụng cho phân phối logistic tổng quát.
Khi đó
1) Hàm mật độ xác suất của X là
 xa
exp 

 b 
, x ∈ℝ;
f ( x) 
2

 x  a 
b  1  exp 

 b 


f đối xứng qua x  a , f tăng trên (, a) , giảm trên (a, ).


2) Hàm phân phối xác suất của X là
 xa 
exp 

 b  , x ∈ℝ;
F ( x) 
 xa
1  exp 

 b 

3) Hàm sinh moomen
M t 

= e at β(1 + bt, 1 – bt) = e at ᴦ(1 + bt)ᴦ(1 – bt)

(-1< t < 1);

4) Hàm phân phối xác suất nghịch đảo
 p 
F 1 ( p)  a  b ln 
 , p  (0,1).
 1 p 

1.2. Một số kiến thức về thống kê
1.2.1. Mẫu ngẫu nhiên, hàm phân phối mẫu và các số đặc trưng mẫu
Định nghĩa 1.2.1. Dãy n biến ngẫu nhiên

 X 1 , X 2 ,..., X n  có phân phối


f ( x, ) (hoặc f ( x )) được gọi là một mẫu ngẫu nhiên từ phân phối f ( x, ) (hoặc
f ( x) ), n được gọi là kích thước mẫu. Giá trị của mẫu thường được kí hiệu

bằng chữ thường  x1 , x2 ,..., xn  .
Định nghĩa 1.2.2. Hàm phân phối mẫu được xác định như sau Fn ( x) 
-∞< x <+∞. Trong đó m là số các X nhỏ hơn x , n là kích thước mẫu.
Tính chất
1) Fn ( x) là hàm liên tục bên trái theo x ;
2) Fn ( x) là hàm đơn điệu tăng theo x ;

10

m
với
n


3) Fn ( x) = 0 với x ≤ min  X 1 , X 2 ,..., X n  ;
4) Fn ( x) = 1 với x ≥max  X 1 , X 2 ,..., X n  ;
5) Hàm phân phối mẫu Fn ( x) hội tụ hầu chắc chắn về hàm phân phối lí
thuyết F ( x) khi kích thước mẫu n tiến ra vô cùng (Định lí Gơ–li–ve –cô).
Định nghĩa 1.2.3. Hàm  ( x )    X 1 , X 2 ,..., X n  từ không gian đo (ℝn,A) vào
không gian đo (T,B) được gọi là một thống kê nếu với bất kì tập B ∈ ß thì
 1 ( B)  A trong đó A là một σ – đại số các tập con Borel của ℝn, ß là σ – đại

số các tập con Borel của không gian T.
Các số đặc trưng mẫu



Trung bình mẫu

Trung bình mẫu được kí hiệu X , được tính theo công thức
X

X1  X 2    X n
.
n

Nếu E ( X i )  a, D ( X i )   2 , i  1, 2, , n thì E ( X )  a, D( X ) 

2
.
n

 Phương sai mẫu
Phương sai mẫu được xác định bởi một trong hai công thức sau
1 n
( X i  X )2 ;

n i 1
1 n
Sn2 ( X ) 
( X i  X )2.

n  1 i 1
Sn2 ( X ) 

 Mômen mẫu
Mômen gốc bậc k: Mômen gốc bậc k của biến ngẫu nhiên X được kí

hiệu mk và tính theo công thức
mk 

1 n k
 Xi .
n i 1

Mômen trung tâm bậc k mẫu: Mômen trung tâm bậc k mẫu của biến
ngẫu nhiên X được kí hiệu  k và tính theo công thức
k 

1 n
 ( X i  X )2 .
n i 1

11




Hệ số tương quan mẫu

Cho mẫu ngẫu nhiên ( X1 , Y1 ),,( X n , Yn ) ta định nghĩa hệ số tương quan
mẫu của hai biến ngẫu nhiên X , Y như sau
1 n
 ( X i  X )(Yi  Y )
n i 1
r
.
Sn ( X ) Sn (Y )


1.2.2. Ước lượng tham số của phân phối
Cho mẫu quan sát ( X1 , X 2 ,, X n ) từ phân phối F ( x, ),  V . Trên cơ sở
mẫu quan sát đó ta sẽ tính gần đúng giá trị tham số  (tổng quát tính xấp xỉ
hàm tham số  ( ) ). Bài toán này được gọi là bài toán ước lượng tham số.
Định nghĩa 1.2.4. Thống kê   X 1 , X 2 ,..., X n  xác định trên không gian mẫu
(ℝn, A) lấy giá trị trong (T, B) được gọi là ước lượng tham số  ( ).
1.2.2.1. Phương pháp hợp lý cực đại
Cho mẫu ngẫu nhiên ( X1 , X 2 ,, X n ) độc lập từ phân phối f ( x, ) , trong đó
  (1 ,,r ).
n

Gọi L( X /  )   f ( X /  ) là hợp lý. Khi đó thống kê  ( X 1 , X 2 ,, X n ) được gọi
k 1

là ước lượng hợp lý cực đại của  nếu L X /  ( X ) ≥ L ( X /  ) với mọi θ và gọi





 ( X )   (  ( X ) là ước lượng hợp lý cực đại của hàm tham số  ( ) .





1. Trường hợp một tham số θ
Nếu thỏa mãn các điều kiện sau
+ Tập  x : f ( x ,  )  0  không phụ thuộc vào θ;

+ Tham số θ có thể biến thiên trên một khoảng nào đó của đường thẳng;
+ Với mỗi x và θ, L ( X /  ) tồn tại đạo hàm bậc nhất và bậc hai theo θ
L( X /  ) 2 L( X /  )
,
.

 2

Khi đó việc tìm ước lượng hợp lý cực đại có thể sử dụng phương pháp

12


tìm cực đại của hàm L ( X /  ) , mà ta biết rằng để cho hàm L ( X /  ) có cực trị
địa phương tại    thì điều kiện cần là
trình

L( X /  )
 0 . Vì vậy giải phương


L( X /  )
 0 , sau đó loại trừ các điểm cực tiểu địa phương và điểm uốn,


còn lại là những điểm làm cực đại hàm hợp lý L ( X /  ) .
Tuy nhiên trong thực hành dễ dàng hơn trong việc tính toán thì thay việc
giải phương trình

L( X /  )

 0 ta giải phương trình khác như sau.


Vì L ( X /  ) >0 nên từ

L( X /  )
 0 , ta suy ra


1 L( X /  )
 ln L( X /  )
0
0
L



2. Trường hợp   (1 ,,r ) để tìm  ta giải hệ r phương trình
 ln L( X /  )
 0, i  1, 2, , r.
i

Nếu f ( x, )  0 thì hệ phương trình tương đương với hệ
  ln L ( X /  )
0

1


  ln L ( X /  )


0
 r


Đây là điều kiện cần để L ( X /  ) đạt cực đại.
Đặt uij 

 2 ln L( X /  )
, i, j  1, r.
i  j

 u11 ( X 1 0 )  u1n ( X 1 0 ) 

Khi đó, ma trận A   


 xác định không âm thì tại
u (X  )  a (X  )
 r1 1 0
rr
1 0 

  0 hàm hợp lí L ( X /  ) đạt cực đại.

13


1.2.2.2. Phương pháp Mômen
Cho mẫu quan sát  X 1 , X 2 , , X n  từ phân phối f ( x, ) , trong đó θ là một

số hay một vectơ   1 , ,  r  .
Ước lượng tham số   1 , ,  r  bằng phương pháp mômen là tìm
nghiệm của hệ r phương trình
a1 1 ,,  r   m1


a  ,  ,   m
r
r
 r 1

Giả sử nghiệm của hệ này là  *  1* , ,  r *  . Nghiệm này được gọi là
ước lượng của tham số   1 , ,  r  .
1.2.3. Kiểm định giả thuyết
Giả sử phân phối xác suất của biến ngẫu nhiên X là F ( x, ),  V , ( F ( x) có
thể không phụ thuộc vào tham số). Những giả thuyết về phân phối F ( x) được
gọi là giả thuyết thống kê, kí hiệu là H 0 . Những giả thuyết về phân phối F ( x)
mà khác H 0 được gọi là đối thuyết (hay giả thuyết chọn), kí hiệu K . Nếu
F ( x, ) phụ thuộc vào tham số θ thì những giả thuyết về phân phối xác suất
F ( x, ) chuyển sang giả thuyết về tham số θ.



Nếu tập H 0 chỉ gồm 1 phần tử thì được gọi là giả thuyết đơn;



Nếu tập H 0 có từ 2 phần tử trở lên thì được gọi là giả thuyết hợp;




Nếu tập K chỉ gồm 1 phần tử thì được gọi là đối thuyết đơn;



Nếu tập K có từ 2 phần tử trở lên thì được gọi là đối thuyết hợp.

Kiểm định giả thuyết thống kê là việc chọn một trong hai quyết định
chấp nhận hoặc bác bỏ giả thuyết H 0 . Trên cơ sở mẫu ngẫu nhiên

 X 1 , X 2 , , X n  có thể cho phép ta chọn một trong hai quyết định này và việc
cần làm là ta đi tìm một tiêu chuẩn để dựa vào đó cho phép ta chấp nhận hoặc
bác bỏ giả thuyết.
Tiêu chuẩn kiểm định giả thuyết là một thống kê t ( X ) xác định trên một

14


không gian mẫu  n , nhờ đó ta có thể kiểm định được giả thuyết.
Miền tiêu chuẩn W là tập những điểm của không gian mẫu  n cho phép
ta bác bỏ giả thuyết H0 .
Tiêu chuẩn kiểm định giả thuyết dựa trên cơ sở tính chất của thống kê
t(X) được gọi là tiêu chuẩn kiểm định thống kê. Một cách tổng quát ta có thể
định nghĩa tiêu chuẩn kiểm định ngẫu nhiên như sau.
Định nghĩa 1.2.5. Tiêu chuẩn kiểm định ngẫu nhiên được xác định như hàm
đo được  ( x) sao cho 0   ( x)  1 đối với mọi x . Giả thuyết H 0 bị bác bỏ với
xác suất  ( x) nếu X  x , hàm  ( x) được gọi là hàm tiêu chuẩn của tiêu chuẩn
kiểm định giả thuyết.
1.2.4. Hồi Quy
1.2.4.1. Định nghĩa

Có nhiều bài toán trong các lĩnh vực sinh học, kinh tế, giáo dục, khí
tượng học,… Khi biết được một số giá trị thực nghiệm của các đại lượng,
chẳng hạn hai đại lượng Y và X1 , X 2 ,, X n cần xác định giá trị của Y thông
qua giá trị của X1 , X 2 ,, X n , nghĩa là ta phải tìm hàm y  f ( x1 , x2 ,, xn )  
trong đó  là đại lượng ngẫu nhiên nào đó. Hàm tìm được như vậy được gọi
là hàm hồi quy của đại lượng ngẫu nhiên Y theo đại lượng ngẫu nhiên
X 1 , X 2 , , X n .

Ta có thể hiểu phân tích hồi quy nghiên cứu mối liên hệ phụ thuộc của
một biến (gọi là biến phụ thuộc hay biến được giải thích) với một hay nhiều
biến khác (được gọi là biến độc lập hay giải tích) nhằm ước lượng và dự báo
giá trị trung bình của biến phụ thuộc với các giá trị đã biết của biến độc lập,
nói một cách tổng quát ta có định nghĩa như sau.
Định nghĩa 1.2.6. Gọi hàm hồi quy của đại lượng ngẫu nhiên Y theo các biến
ngẫu nhiên X1 , X 2 ,, X n là kì vọng có điều kiện của đại lượng Y với điều kiện
X1  x1 , X 2  x2 ,, X n  xn . Kí hiệu
E (Y / X1  x1 , X 2  x2 ,, X n  xn )   ( x1 , x2 ,, xn ) .

15


×