Tải bản đầy đủ (.pdf) (83 trang)

Báo cáo cuối kỳ môn phân tích dữ liệu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.99 MB, 83 trang )


BÁO CÁO CUỐI KỲ MƠN HỌC
PHÂN TÍCH DỮ LIỆU (800702(VP_HK211)
HỌ VÀ TÊN: NGUYÊN THANH PHÚ
MÃ SỐ SV: 1810437
GMAIL:
SĐT:0949901937
Tôi không thảo luận với bất kỳ ai về nội dung báo cáo


Phụ lục
CHƯƠNG 1. LÝ THUYẾT XÁC SUẤT ............................................................... 8
1.1 Lịch sử xác suất thông kê .............................................................................. 8
1.1.1

Trong thực tế ........................................................................................ 8

1.1.2

Trong xây dựng .................................................................................... 8

1.2 Định nghĩa ..................................................................................................... 9
1.2.1

Uncertainty ( ộ không chắc chắc) ...................................................... 9

1.2.2

Phép thử ( Random experiment) .......................................................... 9

1.2.3



Không gian mẫu ( Outcome spaces hoặc Sample spaces) ................... 9

1.2.4

Biến cố ( Events) ................................................................................10

A. Biến cố chắc chắn ..................................................................................10
B. Biến cố trống .........................................................................................11
C. Biến cố ngẫu nhiên ................................................................................11
D. Biến cố bằng nhau .................................................................................11
E. Quan hệ giữa các biến cố .......................................................................12
F. Các phép toán tập hợp ............................................................................13
1.3 Xác suất .......................................................................................................15
A. Định nghĩa theo suy luận Frequentist: .....................................................15
B. Định nghĩa cổ iển ...................................................................................16
C. Định nghĩa theo suy luận Bayesian ..........................................................16
D. Định nghĩa xác suất theo tiên ề ..............................................................17
1.4 Các phép tính xác suất .................................................................................19
1.4.1

Xác suất của biến cố ối lập ..........................................................19

1.4.2

Định lý cộng xác suất ..................................................................19

1.4.3

Định lý nhân xác suất ...................................................................20


A. Xác suất có iều kiện ...............................................................................20
B. Biến cố ộc lập .........................................................................................21
C. Định lý nhân xác suất ...............................................................................21


CHƯƠNG 2. BIẾN NGẪU NHIÊN RỜI RẠC ....................................................24
2.1 Biến ngẫu nhiên rời rạc ...............................................................................24
2.1.1

Định nghĩa ..........................................................................................24

A. Biến ngẫu nhiên .....................................................................................24
B. Biến ngẫu nhiên rời rạc (Discrete random variables) ............................24
2.1.2

Các ặc trưng của biến ngẫu nhiên rời rạc ........................................25

A. Kỳ vọng (Expectation) ..........................................................................25
B. Phương sai ( Variance) ..........................................................................26
C. Độ lệch chuẩn (Standard deviation).......................................................28
D. Trung
..................................................................................................28

vị

E. Moment trung tâm (mô-men) ................................................................28
F. Biến ngẫu nhiên chuẩn hóa (Standardized random variables) ..............29
2.1.3 Hàm và phân phối của biến ngẫu nhiên rời rạc ........................................30
A. Hàm khối xác suất ( Probrability mass function) ..................................30

B. Hàm phân phối xác suất .......................................................................31
C. Phân phối Bernoulli ............................................................................33
D. Phân phối nhị thức (Binomial distribution) .........................................34
E.

Phân phối hình học ..............................................................................35

F.

Phân phối Poisson ................................................................................36

CHƯƠNG 3. BIẾN NGẪU NHIÊN LIÊN TỤC ..................................................39
3.1 Biến ngẫu nhiên liên tục ..............................................................................39
3.1.1

Định nghĩa ..........................................................................................39

A. Biến ngẫu nhiên liên tục ........................................................................39
B. Hàm mật ộ xác suất (Probability density function) .............................39
3.1.2

Các ặc trưng của biến ngẫu nhiên liên tục .......................................41

A. Kỳ
..................................................................................................41

vọng


B. Phương

..............................................................................................41

sai

3.2 Các phân phối liên tục .................................................................................41
3.2.1

Phân phối ều .....................................................................................41

3.2.2

Phân phối mũ (Exponential Distribution) ..........................................43

3.2.3

Phân phối chuẩn (Normal Distribution) ............................................44

A. Phân phối chuẩn ....................................................................................44
B. Phân phối chuẩn chuẩn tắc .....................................................................46
C. Tích phân Laplace .................................................................................47
D. Cơng thức tính xác suất ..........................................................................47
3.2.4

Phân phối Chi-Bình phương( Chi-Squared) ......................................49

3.2.5

Phân phối Student ..............................................................................51

3.3 Hệ số Z của Altman .....................................................................................52

3.3.1

Giới thiệu ...........................................................................................52

3.3.2

Công thức ..........................................................................................53

CHƯƠNG 4. KIỂM ĐỊNH GIẢ THIẾT ..............................................................54
4.1 Khái niệm ....................................................................................................54
4.1.1

Giả thiết không (Null Hypothesis) .....................................................54

4.1.2

Giả thiết nghịch (Alternative hypothesis) ..........................................54

4.1.3

Mức ý nghĩa .......................................................................................55

4.1.4

Miền bác bỏ .......................................................................................55

4.1.5

Kiểm ịnh giả thiêt thông kê..............................................................55


4.2 Kiểm ịnh giả thiết tham số ........................................................................57
4.2.1

Kiểm ịnh giá trị kì vọng của phân phối chuẩn .................................57

4.2.2

Kiểm ịnh so sánh hai trung bình ......................................................62

4.2.3

Kiểm ịnh phương sai ........................................................................64

A. Kiểm ịnh phương sai (A chi-square test) .............................................64
B. So sánh phương sai ( F-test) ..................................................................66


4.2.4

Kiểm ịnh tỷ lệ ...................................................................................68

A. Kiểm ịnh giải thiết về tỷ lệ tổng thể ....................................................68
B. Kiểm ịnh so sánh hai tỷ lệ ....................................................................69
4.3 Kiểm ịnh giả thiết phi tham số ..................................................................70
4.3.1

Kiểm ịnh quy luật phân phối (Chi-Square Goodness-of-Fit Test) ..70

A. Trường hợp khơng có những tham số chưa biết ....................................70
B. Trường hợp có những tham số chưa biết ...............................................72

4.4 Kiểm ịnh tính ộc lập (Contingency table) ...............................................73
4.4.1

Bảng tương quan ...............................................................................73

4.4.2

Kiểm ịnh Chi-Squared về tính ộc lập (Chi-square test of

independence) .................................................................................................74
CHƯƠNG 5. QUY HOẠCH TUYẾN TÍNH .......................................................77
5.1 Định nghĩa quy hoạch tuyến tính ...............................................................77
5.2 Sự tồn tại nghiệm và tính chất tập nghiệm quy hoạch tuyến tính ..............78
5.2.1

Sự tồn tại nghiệm ...............................................................................78

5.2.2

Tính chất tập nghiệm .........................................................................82

5.3 Giải bài tốn quy hoạch tuyến tính hai biến bằng phương pháp hình học ..83
5.4 Phương pháp ơn hình ................................................................................88
5.4.1

Thuật tốn ơn hình dạng bảng(Kim, 2008) .....................................89

Tài liệu tham khảo ...................................................................................................97
CHƯƠNG 1. LÝ THUYẾT XÁC SUẤT
1.1


Lịch sử xác suất thông kê
1.1.1

Trong thực tế

Sau sự thiên tài của nhà tốn học người Nga Xơ Viết Andrei Kolmogorov(Mai,
2016), lý thuyết xác suất ã trở thành một nhánh toán học chặt chẽ cung cấp cơ sở cho
việc nghiên cứu các q trình ngẫu nhiên, phép tính ngẫu nhiên và nhiều lý thuyết
toán học ược sử dụng ể hiểu ngẫu nhiên hệ thống cung cấp các ý tưởng và công cụ


mới ể chứng minh toán học các ịnh lý trong các lĩnh vực lý thuyết số, tổ hợp, phương
trình vi phân và vi phân hình học.
1.1.2

Trong xây dựng

Lý thuyết xác suất là nền tảng của thống kê. Có rất nhiều ứng dụng của xác suất
trong xã hội. Ví dụ, chúng ta cần sử dụng lý thuyết xác suất trong các lĩnh vực khác
nhau như kế tốn, tài chính, thiết kế tổ chức và quản lý nguồn nhân lực và ặc biệt
trong ngành xây dựng là ưa ra quyết ịnh trong những iều kiện không chắc chắn.
Điều quan trọng là phải nhận ra rằng những thứ khác nhau có thể xảy ra sai sót trong
q trình khác nhau bao gồm các sự kiện như sai sót và lỗi trong q trình thiết kế,
các hư hỏng và tai nạn trong quá trình xây dựng, vận hành . Các nguyên nhân tiềm
ẩn , sai lầm, hỏng hóc và tai nạn có thể rất nhiều, bao gồm cả lỗi của con người, hư
hỏng của các bộ phận kết cấu, các tình huống tải trọng khắc nghiệt và không kém
phần các mối nguy hiểm của môi trường tự nhiên . Lập kế hoạch cẩn thận trong giai
oạn ầu của dự án là cách duy nhất ể kiểm soát các rủi ro liên quan ến các sự kiện ó.
Tóm lại, phần quan trọng nhất của lý thuyết xác suất là nghiên cứu về ộ không chắc

chắn.
1.2

Định nghĩa
1.2.1

Uncertainty ( ộ không chắc chắc)

“Uncertainty is that which disappears when we become certain”.(Bedford and
Cooke, 2001)
Sự không chắc chắn ề cập ến các tình huống khơng hồn hảo hoặc khơng xác ịnh.
Điều này áp dụng cho các dự oán về các sự kiện trong tương lai, cho các phép o vật
lý ã ược thực hiện hoặc chưa biết. Sự không chắc chắn phát sinh trong bất kỳ lĩnh
vực nào, Trong khoa học và kỹ thuật, sự chắc chắn ạt ược thông qua quan sát, và sự
không chắc chắn là cái ược loại bỏ bằng cách quan sát. Do ó, trong những bối cảnh
này, sự khơng chắc chắn có liên quan ến kết quả của những quan sát có thể có.


1.2.2

Phép thử ( Random experiment)

Là một quá trình dẫn ến một số (có thể là vơ hạn) các kết quả có thể xảy ra và kết
quả thực tế xảy ra phụ thuộc vào các ảnh hưởng khơng thể dự ốn trước. Một phép
thử thường ược lặp lại nhiều lần.
Ví dụ: o chiều cao, làm xét nghiệm, chẩn oán bệnh hay iều trị bệnh,…là các phép
thử.
1.2.3

Không gian mẫu ( Outcome spaces hoặc Sample spaces)


Không gian mẫu Ω là tập hợp của tất cả kết quả có thể có của phép thử ngẫu nhiên.
Khơng gian mẫu hay khơng gian mẫu tồn thể, thường ược ký hiệu là S, Ω hay U
(tức "universal set").
Ví dụ:
+Để nghiên cứu hiện tượng ngẫu nhiên về sự xuất hiện sấp hay ngửa khi tung một
ồng tiền, không gian mẫu của thí nghiệm ó là tập hợp Ω ={ngửa, sấp} Đối với một
số thí nghiệm, có thể có hai hoặc nhiều hơn khơng gian mẫu.
Ví dụ:
+Trong một cuộc ua ngựa, nếu chúng ta chỉ quan sát người chiến thắng, chúng ta có
thể lấy Ω = { tất cả số con ngựa trong cuộc ua} , khi chúng ta coi người chiến thắng
có thể là một trong những con ngựa có mặt ngày hơm ó.
+ Ngồi ra nếu chúng ta quan sát tồn bộ cuộc ua, chúng ta có thể lấy Ω = {thứ tự
xếp hạng có thể xảy ra}
1.2.4

Biến cố ( Events)

Các tập con của không gian mẫu ược gọi là biến cố .


Hình 1. Minh họa tập hợp con
Dựa vào khả năng xuất hiện của hiện tượng chia các hiện tượng thành 3 loại.
A. Biến cố chắc chắn
Biến cố nhất ịnh xảy ra sau phép thử gọi là biến cố chắc chắn, ký hiệu là Ω. + Ví
dụ: Tung một con xúc sắc, gọi A là biến cố có số chấm nhỏ hơn hoặc bằng 6, khi
ó A là biến cố chắc chắn.
B. Biến cố trống
Biến cố nhất ịnh không xảy ra sau phép thử gọi là biến cố khơng thể có ( biến cố
trống) , ký hiệu là Φ.

C. Biến cố ngẫu nhiên
Biến cố có thể xảy ra, cũng có thể xảy ra sau phép thử. Biến cố ngẫu nhiên thường
ược ký hiệu bởi các chữ A, B, C,… hoặc các chữ số kèm theo chỉ số như A1, A2,
B1, B2, C1, C2, C3,…
+ Ví dụ: Nếu gọi Ai là biến cố con xúc sắc xuất hiện mặt có i chấm (i= 1,6 ) thì A1,
A2, A3, A4, A5,A6 là các biến cố ngẫu nhiên.
D. Biến cố bằng nhau
Biến cố A gọi là kéo theo biến cố B nếu A xảy ra thì B xảy ra , ký hiệu là A B
Nếu ồng thời có A B và B A thì các biến cố A và B gọi là bằng nhau.(Huy, 2019)
Ví dụ: Tung một con xúc xắc. nếu gọi Ai là biến cố con xúc sắc xuất hiện mặt có i
chấm (i= 1,6 ), B là biến cố ược số nút chia hết cho 3, C là biến cố ược số nút chẵn.
P2 là biến cố ược số nút nguyên tố chẵn. Khi ó ta có
A2 C, A3 B
A2 P2, P2 A2, A2=P2
Từ các ịnh nghĩa, với mọi biến cố A ta có : A Ω, Ω A


Do các quan hệ này nên ta có: Các biến cố trống ều bằng nhau và các biến cố chắc
chắn ều bằng nhau.
E. Quan hệ giữa các biến cố
Cho hai biến cố A và B . Khi ó ta gọi:
i.

Tổng của A và B, hay A cộng B

Là biến cố xảy ra khi A xảy ra hoặc B xảy ra, ký hiệu A+B. ii.
Tích của A và B, hay A nhân B,
Là biến cố xảy ra nếu A và B ồng thời xảy ra, ký hiệu A.B hoặc AB. iii.
Hiệu của A và B, hay A trừ B
Là biến cố xảy ra nếu A xảy ra nhưng B không xảy ra, ký hiệu A-B.

iv.

Biến cố xung khắc

Hai biến cố A và B gọi là xung khắc nếu chúng không thể ồng thời xảy ra sau
phép thử. Nói cách khác nếu biến cố A ã xảy ra thì biến cố B không xảy ra và
ngược lại, hoặc cả hai biến cố A và B ều không xảy ra sau phép thử. Như vậy,
nếu A và B là hai biến cố xung khắc thì A.B = Φ
+Ví dụ . Tung một con xúc xắc, gọi A là biến cố: “Xuất hiện mặt có chấm số chấm
lớn hơn hoặc bằng 4”, B là biến cố: “Xuất hiện mặt có chấm số chấm nhỏ hơn hoặc
bằng 2”.
Ta thấy hai biến cố và không cùng xảy ra, do ó A và B là hai biến cố xung khắc.
v.

Đôi một xung khắc

Các biến cố A1,A2,…An gọi là ôi một xung khắc nếu hai biến cố khác nhau bất kỳ
trong ó dều là xung khắc, tức là:
Ai.Aj=Φ với mọi i≠j
+Ví dụ: Tung một con xúc sắc


Gọi: Ai = {con xúc sắc xuất hiện mặt có i chấm} (i = 1,6 ) thì A 1 và A2 là hai biến
cố xung khắc, A1 và A6 là hai biến cố xung khắc...., A5 và A6 là 2 biến cố xung khắc,
vậy A1, A2, A3, A4, A5, A6 là một hệ gồm 6 biến cố xung khắc từng ôi.
vi.

Biến cố ối lập

Biến cố ối lập của A là biến cố xảy ra nếu A không xảy ra và không xảy ra nếu A

xảy ra, ký hiệu

𝐴 hoặc 𝐴𝑐. Nếu A

và 𝐴 là 2 biến cố ối lập thì

A+𝐴=

Ω và A. 𝐴 = Φ
+ Ví dụ: Một bà mẹ sinh con, biến cố sinh con trai và biến cố sinh con gái là biến cố
ối lập.
vii.

Nhóm ầy ủ các biến cố

Các biến cố A1,A2,…An gọi là nhóm ầy ủ các biến cố nếu chúng ơi một xung khắc
và ít nhất một trong chúng chắc chắn xảy ra , tức là:
{𝐴𝑖. 𝐴𝑗 = 𝛷 với mọi i ≠ j
𝐴1 + 𝐴2 + ⋯ + 𝐴𝑛 = Ω
+ Ví dụ với mọi biến cố A, hai biến cố A, 𝐴 là một nhóm ầy ủ các biến cố.
F. Các phép tốn tập hợp
i.

Phép giao

Giao của hai tập hợp A và B, kí hiệu A ∩ B là tập hợp gồm các phần tử thuộc A và
B, là biến cố xảy ra khi A và B cùng xảy ra.


Hình 2. Biểu ồ Venn thể hiện phép giao

ii.

Phép hợp

Hợp của hai tập hợp A và B, kí hiệu A

B là tập hợp gồm các phần tử thuộc A

hoặc thuộc B, là biến cố xảy ra khi A xảy ra hoặc B xảy ra hoặc A và B cùng xảy
ra.

Hình 3. Biểu ồ Venn thể hiện phép hợp
iii.

Định luật DeMorgan

Cho hai tập hợp bất kì A và B thì
( A∩ B )C = AC U BC
( AU B )C = AC ∩ BC
+ Ví dụ : Rút gọn biểu thức sau sử dụng ịnh luật DeMorgan: 𝑌 = 𝐴𝐵 + 𝐴𝐵
Giải: 𝑌 = 𝐴𝐵 + 𝐴𝐵 = 𝐴𝐵. 𝐴𝐵
Trong ó : 𝐴𝐵 = 𝐴 + 𝐵 = 𝐴 + 𝐵 𝑣à 𝐴𝐵 = 𝐴 + 𝐵 = 𝐴 + 𝐵
 𝑌 = 𝐴𝐵 + 𝐴𝐵 = 𝐴𝐵. 𝐴𝐵 = (𝐴 + 𝐵).(𝐴 + 𝐵)
= 𝐴. 𝐴 + 𝐴. 𝐵 + 𝐵. 𝐴 + 𝐵. 𝐵 = 0 + 𝐴. 𝐵 + 𝐵. 𝐴 + 0 = 𝐴. 𝐵 + 𝐵. 𝐴
1.3 Xác suất
A. Định nghĩa theo suy luận Frequentist:
Định nghĩa theo suy luận Frequentist của xác suất là cách giải thích iển hình của xác
suất bởi nhà thực nghiệm. Theo cách hiểu này, xác suất P (A) chỉ ơn giản là tần suất



xuất hiện tương ối của sự kiện A như ược quan sát trong một thí nghiệm với n thử
nghiệm, tức là xác suất của một sự kiện A ược xác ịnh là số lần sự kiện A xảy ra chia
cho số thử nghiệm ược thực hiện:(M.H.Faber, 2012)
𝑁𝐴
𝑃(𝐴) = lim
𝑣ớ𝑖 𝑛𝑒𝑥𝑝 → ∞
𝑛𝑒𝑥𝑝
Trong ó 𝑁𝐴 là số lần biến cố A xảy ra, 𝑛𝑒𝑥𝑝 là tổng số lần thử nghiệm.
+ Ví dụ: Theo suy luận Frequentist, khi ưa ra xác suất ể ạt mặt ngửa khi tung ồng
xu, kết quả sẽ khơng có. Ngoại trừ, khi ã nhận ược thêm dữ liệu là sau 1000 lần tung,
thì ạt ược mặt ngửa là 563 lần thì câu trả lời là xác suất sẽ là
0.563 khi tung ra ược mặt ngửa. Tuy nhiên khi tiếp tục tung thì xác suất sẽ dần về
0.5, khi ó ta có nhiều kết quả , rất khó trong việc ưa ra quyết ịnh.Theo ịnh nghĩa xác
suất của Frequentist , chỉ những sự kiện ngẫu nhiên lặp i lặp lại (như kết quả của
việc tung một ồng xu) mới có xác suất. Trường phái Frequentist phủ ịnh việc gắn
xác suất với các giả thuyết hoặc với bất một giá trị cố ịnh mà chưa biết trước.(Thống
kê suy luận – Hai trường phải triết học, 2019)
B. Định nghĩa cổ iển
Định nghĩa xác suất cổ iển bắt nguồn từ những ngày mà phép tính xác suất ược
thành lập bởi Pascal và Fermat(Alsalam, 1998). Giả sử phép thử có n trường hợp
ồng khả năng, trong số ó có m trường hợp thuận lợi cho biến cố A. khi ó ta gọi xác
suất của biến cố A là:(Huy, 2019)
𝑚
𝑃(𝐴) =
𝑛
Như vậy, xác suất của biến cố A là tỷ số về khả năng biến cố xuất hiện.
+Ví dụ:
Tung một ồng tiền cân ối, ồng chất. Gọi S là biến cố ược mặt sấp, N là biến cố ược
mặt ngửa. Ta có P(S) = ½, P(N) =1/2



Trên thực tế, khơng có mâu thuẫn thực sự với suy luận Frequentist, nhưng có thể
nhận thấy những khác biệt sau:
• Thí nghiệm khơng cần tiến hành vì ã biết trước câu trả lời.
C. Định nghĩa theo suy luận Bayesian
Các suy diễn từ Bayesian cho phép ta cập nhật những suy diễn xác suất khi thay ổi
niềm tin con người, các chứng cứ và thông tin từ dữ liệu:
P(A)= mức ộ “niềm tin” mà biến cố A xảy ra
Mức ộ niềm tin là sự phản ánh trạng thái tâm trí của cá nhân về kinh nghiệm, chun
mơn và sở thích.(M.H.Faber, 2012)
Trái ngược với suy luận theo Frequentist, Bayesian là trường phái tạo ra sự linh hoạt
trong o lường khả năng xảy ra của biến cố, nơi mà chúng ta có thể thay ổi xác suất
theo kinh nghiệm một cách linh hoạt thay vì những sự thật tần suất khơ khan(Khanh,
2021). Ưu iểm của trường phái Bayesian ó là hoạt ộng hiệu quả hơn trong các tác vụ
dự báo với kích thước mẫu nhỏ.
+ Ví dụ: Tung một ồng tiền cân ối, ồng chất. Gọi S là biến cố ược mặt sấp, N là
biến cố ược mặt ngửa.Ban ầu bạn thực hiện 3 lần tung và thu ược kịch bản là
[S,N,N].
➢ Theo trường phái Frequentist, Ở lượt tung thứ 4 có quá ít bằng chứng ể bạn
tin rằng xác suất mặt sấp là 1/3, vì lý do số lượt tung quá ít và ồng xu là ồng
chất.
➢ Bạn vẫn có niềm tin về tỷ lệ xác suất là cân bằng giữa hai mặt dựa trên phân
tích lý trí rằng ồng xu là ồng chất nên mặt sấp và mặt ngửa có vai trị bình ẳng.
Tổng xác suất của mặt ngửa và mặt xấp là 1 nên xác suất mỗi mặt sẽ là 1/2.
Khi ưa ra phỏng oán về lượt tung thứ 4 bạn không tin xác suất sẽ là 1/3 là một
sự thật mà tin vào lý trí khi cho rằng xác suất là 1/2. Đây là suy luận theo
Bayeasian.


D. Định nghĩa xác suất theo tiên ề

Ký hiệu A là tập hợp các biến cố trong một phép thử. Ta gọi xác suất là một quy tắc
ặt mỗi A∈A (Ghahramani, 1999)
(I)
(II)

0 ≤ 𝑃(𝐴) ≤ 1, 𝐴 ∈ 𝑨
𝑃(Ω) = 1, 𝑃(𝛷) = 0

(III) Với mội dãy biến cố ôi một xung khắc (An)⊂A

𝑃

𝑃(𝐴𝑖)

Tiên ề (I) : Tiên ề xác suất ầu tiên là xác suất của bất kỳ sự kiện nào là một số thực
khơng âm. Điều này có nghĩa là xác suất nhỏ nhất có thể là 0 và nó khơng thể là vơ
hạn. Bộ số mà chúng ta có thể sử dụng là số thực. Điều này ề cập ến cả số hữu tỉ,
còn ược gọi là phân số và số vô tỉ không thể ược viết dưới dạng phân số.
Một iều cần lưu ý là tiên ề này khơng nói gì về xác suất của một sự kiện có thể lớn
như thế nào. Tiên ề loại trừ khả năng xảy ra các xác suất âm. Nó phản ánh quan iểm
rằng xác suất nhỏ nhất, dành riêng cho các sự kiện không thể xảy ra, bằng không.
Tiên ề (II) : Tiên ề thứ hai về xác suất là xác suất của tồn bộ khơng gian mẫu là
một. Nói một cách hình tượng, chúng ta viết P ( A) = 1. Ngụ ý trong tiên ề này là
khái niệm rằng khơng gian mẫu là mọi thứ có thể cho thí nghiệm xác suất của chúng
ta và rằng khơng có sự kiện nào bên ngồi khơng gian mẫu.
Tự nó, tiên ề này không ặt giới hạn trên về xác suất của các sự kiện khơng phải là
tồn bộ khơng gian mẫu. Nó phản ánh rằng một cái gì ó chắc chắn tuyệt ối có xác
suất là 100%.
Tiên ề (III) :Tiên ề thứ ba về xác suất ề cập ến các sự kiện loại trừ lẫn nhau. Tiên ề
thứ ba cho rằng ối với một chuỗi các sự kiện loại trừ lẫn nhau, xác suất xuất hiện của

ít nhất một trong số chúng bằng tổng xác suất của chúng.
Mặc dù tiên ề thứ ba này có vẻ khơng hữu ích cho lắm, nhưng chúng ta sẽ thấy rằng
kết hợp với hai tiên ề kia, nó thực sự khá mạnh mẽ.


1.4 Các phép tính xác suất
1.4.1

Xác suất của biến cố ối lập

Với mọi biến cố A, ta có 𝑃(𝐴) = 1 − 𝑃(𝐴)
Chứng minh : Ta có theo tiên ề III và I
P((𝐴 + 𝐴) = 𝑃(𝐴) + 𝑃(𝐴) 𝑚à 𝑃(𝐴 + 𝐴) = 𝑃(Ω) => 𝑃(𝐴 + 𝐴) = 1
+Ví dụ: Tung 2 con xúc xắc. Ta có khơng gian mẫu Ω = {(𝑖, 𝑗): 1 ≤ 𝑖 ≤ 6, 1 ≤
𝑗≤6}
Gọi A là biến cố tổng hai mặt bằng 4 => A={(1.3),(2,2), (3,1)}
 P(A)=3/36.
Sẽ rất khó ể ếm ủ trường hợp sẽ ra hai mặt có tổng khác 4. Theo ịnh lý của biến cố
ối lặp, P(Ac)=1-3/36=33/36
1.4.2

Định lý cộng xác suất

➢ Nếu A1,A2,…An là các biến cố ôi một xung khắc thì
𝑃(𝐴1 + 𝐴2 + ⋯ + 𝐴𝑛) = 𝑃(𝐴1) + 𝑃(𝐴2) + ⋯ + 𝑃(𝐴𝑛)
➢ Với các biến cố tùy ý A và B, ta có:
𝑃(𝐴 + 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴. 𝐵)
Chứng minh:
Giả sử trong n trường hợp ồng khả năng có thể xảy ra của phép thử:
+ Có m1 trường hợp thuận lợi cho việc xuất hiện của biến cố A, tức là: P(A)=m1/n

+ Có m2 trường hợp thuận lợi cho việc xuất hiện của biến cố B, tức là: P(B) =m2/n +
Có m trường hợp thuận lợi cho việc xuất hiện cả biến cố A và B, tức là có m trường
hợp thuận lợi cho việc xuất hiện biến cố tích A.B. Do ó P(A.B) =m.n khi ó số trường
hợp thuận lợi cho việc xuất hiện của biến cố tổng (A + B) là:


(m1 + m2 – m).
m1 + m2 – m =

Vì vậy P(A+B) =

𝑃(𝐴 + 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴. 𝐵)

𝑛

+Ví dụ: Có 400 người trong 1 sự kiện. Trong ó 300 người tham gia ạp xe hoặc bơi
, 160 người bơi và 120 người bơi và ạp xe. Xác suất ể chọn ra người tham gia bơi.
Giải: Gọi A là biến cố người tham gia bơi,B là biến cố người tham gia ạp xe.
Khi ó A+B là biến cố người tham gia ạp xe hoặc bơi
Ta có P(A+B)=300/400, P(A)=160/400, P(AB) =120/400.
Theo ịnh lý: P(B) = P(A+B)+P(AB) –P(A)
= 300/400+120/400-160/400=260/400=0.65
1.4.3

Định lý nhân xác suất

A. Xác suất có iều kiện
Cho hai biến cố A và B. Ta gọi xác suất của biến cố A khi biến cố B ã xảy ra là xác
suất của A với iều kiện B, ký hiệu P(A/B)
+Ví dụ: Giả sử 1 lớp chia làm 3 nhóm thực tập. Nhóm I có 30 sinh viên trong ó có

10 nữ, nhóm II có 25 sinh viên trong ó có 10 nữ, nhóm III có 25 sinh viên trong ó có
8 nữ. Chọn ngẫu nhiên trong lớp ra một sinh viên, tìm xác suất ể ó là sinh viên nữ
thuộc nhóm 2?
Giải: Gọi B là biến cố sinh viên chọn ra là nữ
A là biến cố sinh viên thuộc nhóm 2
 P(B/A) = 0,4
B. Biến cố ộc lập
Hai biến cố A và B ọc lập nếu xác suất của biến cố này không phụ thuộc vào sự xảy
ra hay không xảy ra của biến cố kia, tức là :
𝑃(𝐴 /𝐵) = 𝑃(𝐴) 𝑣à 𝑃(𝐵 /𝐴) = 𝑃(𝐵)


+ Ví dụ: Khi tung 2 ồng xu, rõ ràng ồng xu này có xuất hiện mặt sấp hay khơng,
cũng không ảnh hưởng tới xác suất ể ồng xu kia xuất hiện mặt sấp (hay ngửa). Như
vậy, việc bà mẹ này sinh con trai hay không, cũng không ảnh hưởng tới xác suất sinh
con trai (gái) của bà mẹ khác. Ta ã nhận biết ưuọc các biến cố vừa xét là ộc lập.
C. Định lý nhân xác suất
i.

Với các biến cố tùy ý A và B, ta có:
𝑃(𝐴𝐵) = 𝑃(𝐴).𝑃(𝐴 /𝐵) = 𝑃(𝐴).𝑃(𝐵 /𝐴)

Chứng minh:
Giả sử:n là số kết quả có thể có khi thực hiện phép thử,m1 là số trường hợp thuận lợi
cho biến cố A xảy ra ,m2 là số trường hợp thuận lợi cho biến cố B xảy ra, m là số
trường hợp thuận lợi cho cả biến cố A và B xảy ra khi ó P(A.B) =m/n và P(A)=m1.n
Ta i tìm P(B/A), với iều kiện biến cố A ã xảy ra rồi thì số kết cục duy nhất ồng
khảnăng của phép thử ối với biến cố B là m1 , trong ó m là kết cục thuận lợi cho
biến cố B xảy ra.
Khi ó theo ịnh nghĩa ta có: P(B/A) =m/m 1=


𝑚/𝑛 =

P(A.B)/P(A)

𝑚1/𝑛

Vậy p(A.B) = p(A).p(B/A)
Hoàn toàn tương tự ta cũng có thể chứng minh ược p(A.B) = p(B).p(A/B)
+ Ví dụ:
Một tập gồm 10 chứng từ, trong ó có 2 chứng từ khơng hợp lệ. Một cán bộ kế toán
rút ngẫu nhiên 1 chứng từ và tiếp ó rút ngẫu nhiên 1 chứng từ khác ể kiểm tra.
a. Tính xác suất ể cả 2 chứng từ rút ra ều hợp lệ.
b. Nếu người ó rút chứng từ thứ ba. Tính xác suất ể trong chứng từ rút ra chỉ có
chứng từ thứ 3 khơng hợp lệ.
Giải: Gọi A = {cả 2 chứng từ rút ra ều hợp lệ}.


B = {trong 3 chứng từ rút ra, chỉ có chứng từ thứ 3 không hợp lệ}
Nếu gọi Ai = {chứng từ rút ra lần thứ i là hợp lệ} (i = 1,3). Khi ó ta có :
A = A1 . A2 và B = A1 . A2 . A3 Vì
vậy các xác suất cần tìm là:
P(A) = P(A1 . A2) = P(A1). P(A2/ A1) =

. =

.
P(B) = P(A1 . A2 . A3) = P(A1). P(A2/A1) . P(
ii.


𝐴3/A1 . A2)=

. . =

Hệ quả

Nếu A và B là hai biến cố ộc lập:
𝑃(𝐴𝐵) = 𝑃(𝐴).𝑃(𝐵)
Tổng quát:
➢ Nếu trong một phép thử, các biến cố A1, A2, …, An có thể cùng
xảy ra thì:
P(A1. A2. …. An) = P(A1).P( A2/A1)….P(An/A1. A2. …. An-1).
➢ Nếu các biến cố A1, A2, …, Ak ộc lập thì: P(A1. A2. …. An) =
P(A1).P( A2)….P(An)
+ Ví dụ:
Một công nhân ứng hai máy hoạt ộng ộc lập nhau. Xác suất ể máy thứ nhất, máy thứ
2 không bị hỏng trong một ca làm việc lần lượt là 0,9 và 0,8. Tính xác suất ể cả 2
máy ều khơng bị hỏng trong một ca làm việc.
Giải:
Gọi A = {cả 2 máy ều không bị hỏng trong một ca làm việc}
Nếu gọi Ai = { máy thứ i không bị hỏng trong một ca làm việc} (i =1,2), khi ó ta có:
A = A1.A2


Vì vậy xác suất cần tìm là: P(A) = p(A1.A2)
Theo giả thiết A1, A2 là 2 biến cố ộc lập với nhau nên ta có:
P(A) = P(A1.A2) = P(A1).P(A2) = 0,72
CHƯƠNG 2. BIẾN NGẪU NHIÊN RỜI RẠC
2.1 Biến ngẫu nhiên rời rạc
2.1.1


Định nghĩa

A. Biến ngẫu nhiên
Giả sử A1,A2,…An là một nhóm ầy ủ các biến cố. Khi ó có một quy tắc X ặt mỗi
biến cố Ai với một số xi(i=1,

𝑛) gọi là một ại lượng ngẫu nhiên. Đại lượng

ngẫu nhiên cịn gọi là biến ngẫu nhiên. (Huy, 2019)
+ Ví dụ:
Tung một con xúc xắc. Gọi X là số nút xuất hiện. Khi ó X là ại lượng ngẫu nhiên.
Tập giá trị của X là {1,2,3,4,5,6} nên ta thờng viết:
X={1,2,3,4,5,6}
B. Biến ngẫu nhiên rời rạc (Discrete random variables)
Là biến ngẫu nhiên mà giá trị có thể có của nó lập thành một tập hợp hữu hạn hoặc
ếm ược các giá trị. Nói cách khác, ta có thể liệt kê tất cả các giá trị của biến ngẫu
nhiên ó.
+Ví dụ:
Tung một ồng tiền cho ến khi ược mặt ngửa thì dừng. Gọi X là số lần tung. Khi ó X
là ại lượng ngẫu nhiên:
X={1,2,…,n}
Đại lượng ngẫu nhiên có dạng:
X={x1,x2,…,xn,…}


Các ại lượng này có các giá trị rời nhau, gọi là ại lượng ngẫu nhiên rời rạc.
2.1.2

Các ặc trưng của biến ngẫu nhiên rời rạc


A. Kỳ vọng (Expectation)
i.

Kỳ vong ược sử dụng ầu tiên bởi Pascal nhưng sau này ược phổ biến và trình
bày bởi Huygens vào cuối thế kỉ thứ 17.

Cho X là ại lượng ngẫu nhiên rời rạc nhận một trong các giá trị có thể có x 1,x2,…,xn
với xác suất tương ứng p 1, p 2,…pn thì ky vọng của X, ký hiệu là E(X) ược tính theo
cơng thức:
𝜇 =E(X)= x 1p 1+x2p2+….+xnpn+….=∑∞𝑛=1 𝑥𝑛𝑝𝑛
Vậy: Kỳ vọng của ại lượng ngẫu nhiên là trung bình theo xác suất các giá trị có thể
nhận cảu ại lượng ngẫu nhiên ó. E(X) là một giá trị trung bình của các x i, mỗi xi
ược tính với tỷ trọng p i
+Ví dụ thực tế:(Ghahramani, 1999)
Trong một ván bài casino, xác suất thua 1$ mỗi ván là 0.6, xác suất thắng 1 $, 2$ và
3$ mỗi ván lần lượt là 0.3, 0.08 và 0.02.
Thực tế cho thấy, nếu người chơi chỉ ánh ít ván, người ó phụ thuộc vào may mắn
của mình nhiều hơn bất kỳ kĩ năng nào. Chẳng hạn, khi chơi 1 ván, người ó có thể
thắng 3$ trong khi ang có 60% tỷ lệ thua 1$.
Tuy nhiên , khi chơi nhiều ván, thì tỷ lệ chiến thắng sẽ phụ thuộc vào số lần chơi
nhiều hơn là may mắn. Gọi n là số ván chơi. Xác suất lần lượt là 0.6n cho lần thua
1$; 0.3n,0.08n và 0.02n cho lần thắng 1$, 2$ và 3$.
Ta có: 0.6𝑛 × (−1) + 0.3𝑛 × 1 + 0.08𝑛 × 1 + 0.02𝑛 × 1 = −0.08𝑛
Vậy ta có trung bình mỗi ván ta mất 0.08$. Tóm lại, người ấy càng chơi nhiều ván,
sự may mắn sẽ ít ược phụ thuộc. Bài tốn cho giá trị E(X) khi này là âm(-0.08), có
nghĩa, càng chơi nhiều ván thì tỷ lệ thua của ta càng nhiều. Nếu kỳ vọng E(X) =0 thì
khi càng chơi, người chơi sẽ tiến dần ến sự hịa vốn.
ii.


Tính chất của kỳ vọng


Với mọi ại lượng ngẫu nhiên X, Y và hằng số C ta có: ➢
Kỳ vọng của hằng số bằng chính nó
𝐸(𝐶) = 𝐶
➢ Kỳ vọng của tổng các biến ngẫu nhiên bằng tổng các kỳ vọng của mỗi biến
ngẫu nhiên thành phần
𝐸(𝑋 + 𝑌) = 𝐸(𝑋) + 𝐸(𝑌)
➢ Tính kỳ vọng của tích hằng số và biến ngẫu nhiên thì có thể ưa hằng số ra
ngồi:
𝐸(𝐶𝑋) = 𝐶𝐸(𝑋)
➢ Kỳ vọng của tích hai biến ngẫu nhiên ộc lập bằng tích các kỳ vọng của chúng
𝐸(𝑋𝑌) = 𝐸(𝑋).𝐸(𝑌)
B. Phương sai ( Variance)
i. Cho X là một ại lượng ngẫu nhiên có kỳ vọng E(X). Khi ó ta gọi phương sai
của X là kì vọng của bình phương ộ sái khác giữa X và E(X), ký hiệu là
D(X). Vậy:
𝐷(𝑋) = 𝐸[(𝑋 − 𝐸(𝑋))2]
Nếu D(X) lớn chứng tỏ sự biến ộng của X lớn, nếu D(X) nhỏ thì các giá trị của
X biến ộng ít, tương ối ổn ịnh.
Lưu ý:


Phương sai càng lớn thì ta nói biến càng biến ộng, càng dao ộng, càng phân

tán.


Phương sai càng nhỏ thì ta nói biến càng ổn ịnh, càng tập trung, càng ồng ều.

Đơn vị của phương sai là bình phương ơn vị của biến ngẫu nhiên. Nếu X có ơn vị

là USD thì V(X) ơn vị là USD2; nếu X ơn vị là m (mét) thì V(X) có ơn vị là m2.
Vì phương sai liên quan ến phép tính bình phương, ơn vị của phương sai biến trở
thành bình phương ơn vị của biến, nên không thể so sánh phương sai với kỳ vọng
hay với giá trị của biến. Để dùng cho các phân tích tiếp theo, người ta tính một ại


lượng là căn bậc hai của phương sai, gọi là ộ lệch chuẩn. ii.

Tính chất của

phương sai
Với mọi ại lượng ngẫu nhiên X,Y và hằng số C ta có:
➢ Phương sai của hằng số bằng không:
D(X)≥ 0, 𝐷(𝐶) = 0
➢ Phương sai của tích ngẫu nhiên với hằng số bằng bình phương hằng số nhân
với phương sai của biến ngẫu nhiên
𝐷(𝐶𝑋) = 𝐶2𝐷(𝑋)
➢ 𝐷(𝑋) = 𝐸(𝑋) − (𝐸(𝑋))2, hệ quả chứng minh từ tính chất kỳ vọng
➢ Phương sai của tổng các biến ngẫu nhiên ộc lập bằng tổng các phương sai
cảu hai biến ngẫu nhiên ó:
𝐷(𝑋 + 𝑌) = 𝐷(𝑋) + 𝐷(𝑌) 𝑛ế𝑢 𝑋 𝑣à 𝑌 độ𝑐 𝑙ậ𝑝
C. Độ lệch chuẩn (Standard deviation)
Độ lệch chuẩn cũng có ý nghĩa như phương sai. Độ lêch chuẩn của biến ngẫu nhiên
X, ký hiệu là (X), là căn bậc hai của phương sai của X:
𝑛

𝐸


𝑥2𝑖𝑝𝑖 ; 𝜎 = √𝐷(𝑋)

Điều khác biệt lớn nhất là ộ lệch chuẩn có ơn vị là ơn vị của X, và như vậy có thể so
sánh ộ lệch chuẩn với giá trị có thể có của X, so sánh với kỳ vọng của X.
+ Ví dụ:
Tung xúc sắc cân ối, phương sai của biến ngẫu nhiên X cho ra một mặt bất kỳ là:
Ta có p(x)=1/6; X=1,2,3,4,5,6
E(X)=∑6𝑥=1 x𝑝

𝐸

𝑥=1 x =

(1 + 2 + 3 + 4 + 5 + 6) =

𝑝(𝑥)

Vậy: D(X)=E(X2)-[E(X)]2=91/6-49/4=35/12


D. Trung vị
Trung vị ( median) là iểm chia ều xác suất thành 2 phần giống nhay, kí hiệu là
med(X):
𝑃(𝑋 < 𝑚𝑒𝑑(𝑋)) = 𝑃(𝑋 ≥ 𝑚𝑒𝑑(𝑋)) = 05
E. Moment trung tâm (mơ-men)
Cho X là ại lượng ngẫu nhiên có kỳ vọng E(X)=a. Ta gọi moment trung tâm cấp k
của X là :(Huy, 2019)
𝜇𝑘 = 𝜇𝑘(𝑋) = 𝐸(𝑋 − 𝑎)𝑘
Ta gọi moment gốc cấp k là 𝛾𝑘 = 𝐸(𝑋𝑘)
Nhận xét:

➢ Khi a=E[X] người ta thường gọi là moment quy tâm, còn a=0 gọi là moment
gốc.
➢ Kỳ vọng là moment bậc 1 với a=0, gọi là moment gốc bậc 1
➢ Phương sai là moment bậc 2 với a=E[X], gọi là moment quy tâm bậc 2
+ Ví dụ:
Cho X có bảng phân phối xác suất sau:
X
-1
0
P
0.1
0.2
Tìm các moment ến cấp 2

1
0.4

2
0.3

𝛾0 = 1; 𝛾1 = 𝑎 = 0.9; 𝛾2 = 1.7
Vậy: 𝜇2 = 1.7 − 0.9 2 = 0.89
F. Biến ngẫu nhiên chuẩn hóa (Standardized random variables)
Cho X là biến ngẫu nhiên có kỳ vọng 𝜇 và phương sai σ². Khi ó biến ngẫu nhiên với
công thức :
∗=

𝑋−𝜇

𝑋

𝜎


Đại lượng X* ược gọi là biến ngẫu nhiên chuẩn hóa của X
Khi chuẩn hóa biến ngẫu nhiên X, ta biến nó trở thành giá trị kỳ vọng và biến ơn vị
về ơn vị của ộ lệch chuẩn. Lúc này, ta sẽ so sánh các ại lượng với nhau mà không
cần sự cạn thiệp của ơn vị o ban ầu. Sự chuẩn hóa trở nên có ích khi ược so sánh hai
hoặc nhiều biến ngẫu nhiên lại với nhau.
+Ví dụ:
Trong một lớp học, bạn Nam ược iểm cuối kỳ trong mơn tốn và mơn văn lần lượt
là 72 và 85. Trong ó, mơn Văn có số iểm trung bình và ộ lệch chuẩn lần lượt là 82
và 7. Và môn Tốn có số iểm trung bình và ộ lệch chuẩn lần lượt là 68 và 4.
• Đánh giá từ số liệu cuối kỳ, bạn Nam là một học sinh giỏi Văn hơn là một
học sinh giỏi mơn Tốn. Nhưng thực tế có thể khơng phải như thế.
• Khi chúng ta chuẩn hóa số iểm của bạn Nam:
X(tốn)=(72-68)/4=1( ơn vị ộ lệch chuẩn)
X(văn)=(85-82)/7=0.43( ơn vị ộ lệch chuẩn)
Điều này i tới kết luận, ộ lệch so với giá trị trung bình mơn trong lớp tốn của bạn
Nam lớn hơn số liệu trong lớp văn. Vậy thực chất, bạn Nam giỏi môn Tốn hơn giỏi
mơn văn.
Hàm và phân phối của biến ngẫu nhiên rời rạc

2.1.3

A. Hàm khối xác suất ( Probrability mass function)
i.

Hàm khối xác suất p(x) của một biến ngẫu nhiên rời rạc X ược ịnh nghĩa
là :
𝑝(𝑥) = 𝑃(𝑋 = 𝑥)


Giả sử X là các giá trị X={x1,x2,…,xn,…} khi ấy: ta ược X=xi: p(xi)=P(X=x i)≠0 ii.
Tính chất của hàm khối
➢ 0 ≤ 𝑝(𝑥) ≤ 1
➢ ∑𝑛𝑖=1 𝑝(𝑥𝑖) = 1


×