Tải bản đầy đủ (.pdf) (98 trang)

Báo cáo cuối kì môn học xác suất thống kê

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (10.99 MB, 98 trang )

3/11/22, 10:20 PM

BÁO CÁO CUỐI KỲ MÔN HỌC 800702 NGUYỄN Thanh PHÚ 1810437

TRƯỜNG ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC BÁCH KHOA THÀNH PHỐ HỒ CHÍ MINH
CHƯƠNG TRÌNH KỸ SƯ CHẤT LƯỢNG CAO VIỆT PHÁP




PHÂN TÍCH DỮ LIỆU

GIẢNG VIÊN HƯỚNG DẪN:

SINH VIÊN THỰC HIỆN:

Trần Nguyễn Ngọc Cương

Nguyễn Thanh Phú-1810437

TP HỒ CHÍ MINH, 2021

1/98


3/11/22, 10:20 PM

BÁO CÁO CUỐI KỲ MÔN HỌC 800702 NGUYỄN Thanh PHÚ 1810437

BÁO CÁO CUỐI KỲ MƠN HỌC


PHÂN TÍCH DỮ LIỆU (800702(VP_HK211)
HỌ VÀ TÊN: NGUYÊN THANH PHÚ
MÃ SỐ SV: 1810437
GMAIL:
SĐT:0949901937
Tôi không thảo luận với bất kỳ ai về nội dung báo cáo

2/98


3/11/22, 10:20 PM

BÁO CÁO CUỐI KỲ MÔN HỌC 800702 NGUYỄN Thanh PHÚ 1810437

Phụ lục
CHƯƠNG 1. LÝ THUYẾT XÁC SUẤT ...............................................................8
1.1 Lịch sử xác suất thông kê ..............................................................................8
1.1.1

Trong thực tế ........................................................................................8

1.1.2

Trong xây dựng....................................................................................8

1.2 Định nghĩa .....................................................................................................9
1.2.1

Uncertainty ( độ không chắc chắc) ......................................................9


1.2.2

Phép thử ( Random experiment) ..........................................................9

1.2.3

Không gian mẫu ( Outcome spaces hoặc Sample spaces) ...................9

1.2.4

Biến cố ( Events)................................................................................10

A. Biến cố chắc chắn ..................................................................................10
B. Biến cố trống ..........................................................................................11
C. Biến cố ngẫu nhiên.................................................................................11
D. Biến cố bằng nhau ..................................................................................11
E. Quan hệ giữa các biến cố .......................................................................12
F. Các phép toán tập hợp............................................................................13
1.3 Xác suất .......................................................................................................15
A. Định nghĩa theo suy luận Frequentist: .....................................................15
B.

Định nghĩa cổ điển ...................................................................................16

C.

Định nghĩa theo suy luận Bayesian ..........................................................16

D. Định nghĩa xác suất theo tiên đề ..............................................................17
1.4 Các phép tính xác suất .................................................................................19


3/98


3/11/22, 10:20 PM

BÁO CÁO CUỐI KỲ MÔN HỌC 800702 NGUYỄN Thanh PHÚ 1810437

1.4.1 Xác suất của biến cố đối lập .....................................................................19
1.4.2

Định lý cộng xác suất.........................................................................19

1.4.3 Định lý nhân xác suất ...............................................................................20
A. Xác suất có điều kiện ...............................................................................20
B.

Biến cố độc lập .........................................................................................21

C.

Định lý nhân xác suất ...............................................................................21

CHƯƠNG 2. BIẾN NGẪU NHIÊN RỜI RẠC ....................................................24
2.1 Biến ngẫu nhiên rời rạc ...............................................................................24
2.1.1

Định nghĩa..........................................................................................24

A. Biến ngẫu nhiên .....................................................................................24

B. Biến ngẫu nhiên rời rạc (Discrete random variables) ............................24
2.1.2

Các đặc trưng của biến ngẫu nhiên rời rạc ........................................25

A. Kỳ vọng (Expectation) ...........................................................................25
B. Phương sai ( Variance) ..........................................................................26
C. Độ lệch chuẩn (Standard deviation).......................................................28
D. Trung vị..................................................................................................28
E. Moment trung tâm (mơ-men) ................................................................28
F. Biến ngẫu nhiên chuẩn hóa (Standardized random variables) ..............29
2.1.3 Hàm và phân phối của biến ngẫu nhiên rời rạc........................................30
A. Hàm khối xác suất ( Probrability mass function).....................................30
B. Hàm phân phối xác suất .........................................................................31
C. Phân phối Bernoulli ...............................................................................33

4/98


3/11/22, 10:20 PM

BÁO CÁO CUỐI KỲ MÔN HỌC 800702 NGUYỄN Thanh PHÚ 1810437

D. Phân phối nhị thức (Binomial distribution) ...........................................34
E. Phân phối hình học.................................................................................35
F. Phân phối Poisson ..................................................................................36
CHƯƠNG 3. BIẾN NGẪU NHIÊN LIÊN TỤC ..................................................39
3.1 Biến ngẫu nhiên liên tục ..............................................................................39
3.1.1


Định nghĩa..........................................................................................39

A. Biến ngẫu nhiên liên tục ........................................................................39
B. Hàm mật độ xác suất (Probability density function) .............................39
3.1.2

Các đặc trưng của biến ngẫu nhiên liên tục .......................................41

A. Kỳ vọng ..................................................................................................41
B. Phương sai..............................................................................................41
3.2 Các phân phối liên tục .................................................................................41
3.2.1

Phân phối đều .....................................................................................41

3.2.2

Phân phối mũ (Exponential Distribution) ..........................................43

3.2.3

Phân phối chuẩn (Normal Distribution) ............................................44

A. Phân phối chuẩn .....................................................................................44
B. Phân phối chuẩn chuẩn tắc.....................................................................46
C. Tích phân Laplace ..................................................................................47
D. Cơng thức tính xác suất..........................................................................47
3.2.4

Phân phối Chi-Bình phương( Chi-Squared) ......................................49


3.2.5

Phân phối Student ..............................................................................51

3.3 Hệ số Z của Altman .....................................................................................52

5/98


3/11/22, 10:20 PM

BÁO CÁO CUỐI KỲ MÔN HỌC 800702 NGUYỄN Thanh PHÚ 1810437

3.3.1

Giới thiệu ...........................................................................................52

3.3.2

Công thức ...........................................................................................53

CHƯƠNG 4. KIỂM ĐỊNH GIẢ THIẾT ..............................................................54
4.1 Khái niệm ....................................................................................................54
4.1.1

Giả thiết không (Null Hypothesis) .....................................................54

4.1.2


Giả thiết nghịch (Alternative hypothesis) ..........................................54

4.1.3

Mức ý nghĩa .......................................................................................55

4.1.4

Miền bác bỏ........................................................................................55

4.1.5

Kiểm định giả thiêt thông kê..............................................................55

4.2 Kiểm định giả thiết tham số ........................................................................57
4.2.1

Kiểm định giá trị kì vọng của phân phối chuẩn .................................57

4.2.2

Kiểm định so sánh hai trung bình ......................................................62

4.2.3

Kiểm định phương sai ........................................................................64

A. Kiểm định phương sai (A chi-square test) .............................................64
B. So sánh phương sai ( F-test) ..................................................................66
4.2.4


Kiểm định tỷ lệ...................................................................................68

A. Kiểm định giải thiết về tỷ lệ tổng thể ....................................................68
B. Kiểm định so sánh hai tỷ lệ....................................................................69
4.3 Kiểm định giả thiết phi tham số ..................................................................70
4.3.1

Kiểm định quy luật phân phối (Chi-Square Goodness-of-Fit Test) ..70

A. Trường hợp khơng có những tham số chưa biết ....................................70
B. Trường hợp có những tham số chưa biết ...............................................72

6/98


3/11/22, 10:20 PM

BÁO CÁO CUỐI KỲ MÔN HỌC 800702 NGUYỄN Thanh PHÚ 1810437

4.4 Kiểm định tính độc lập (Contingency table) ...............................................73
4.4.1

Bảng tương quan ................................................................................73

4.4.2

Kiểm định Chi-Squared về tính độc lập (Chi-square test of

independence) ..................................................................................................74

CHƯƠNG 5. QUY HOẠCH TUYẾN TÍNH .......................................................77
5.1 Định nghĩa quy hoạch tuyến tính ................................................................77
5.2 Sự tồn tại nghiệm v tính chất tập nghiệm quy hoạch tuyến tính ...............78
5.2.1

Sự tồn tại nghiệm ...............................................................................78

5.2.2

Tính chất tập nghiệm .........................................................................82

5.3 Giải bài tốn quy hoạch tuyến tính hai biến bằng phương pháp hình học ..83
5.4 Phương pháp đơn hình ................................................................................88
5.4.1

Thuật tốn đơn hình dạng bảng(Kim, 2008) .....................................89

Tài liệu tham khảo....................................................................................................97

7/98


3/11/22, 10:20 PM

BÁO CÁO CUỐI KỲ MÔN HỌC 800702 NGUYỄN Thanh PHÚ 1810437

CHƯƠNG 1. LÝ THUYẾT XÁC SUẤT
1.1

Lịch sử xác suất thông kê

1.1.1

Trong thực tế

Sau sự thiên tài của nhà tốn học người Nga Xơ Viết Andrei Kolmogorov(Mai,
2016), lý thuyết xác suất đã trở thành một nhánh toán học chặt chẽ cung cấp cơ sở
cho việc nghiên cứu các quá trình ngẫu nhiên, phép tính ngẫu nhiên và nhiều lý
thuyết toán học được sử dụng để hiểu ngẫu nhiên hệ thống cung cấp các ý tưởng và
công cụ mới để chứng minh toán học các định lý trong các lĩnh vực lý thuyết số, tổ
hợp, phương trình vi phân v vi phân hình học.
1.1.2

Trong xây dựng

Lý thuyết xác suất là nền tảng của thống kê. Có rất nhiều ứng dụng của xác suất
trong xã hội. Ví dụ, chúng ta cần sử dụng lý thuyết xác suất trong các lĩnh vực
khác nhau như kế tốn, tài chính, thiết kế tổ chức và quản lý nguồn nhân lực và đặc
biệt trong ngành xây dựng là đưa ra quyết định trong những điều kiện không chắc
chắn.
Điều quan trọng là phải nhận ra rằng những thứ khác nhau có thể xảy ra sai sót
trong quá trình khác nhau bao gồm các sự kiện như sai sót v lỗi trong q trình
thiết kế, các hư hỏng và tai nạn trong quá trình xây dựng, vận hành . Các nguyên
nhân tiềm ẩn , sai lầm, hỏng hóc và tai nạn có thể rất nhiều, bao gồm cả lỗi của con
người, hư hỏng của các bộ phận kết cấu, các tình huống tải trọng khắc nghiệt và
khơng kém phần các mối nguy hiểm của môi trường tự nhiên . Lập kế hoạch cẩn
thận trong giai đoạn đầu của dự án là cách duy nhất để kiểm soát các rủi ro liên
quan đến các sự kiện đó.
Tóm lại, phần quan trọng nhất của lý thuyết xác suất là nghiên cứu về độ không
chắc chắn.


8/98


3/11/22, 10:20 PM

1.2

BÁO CÁO CUỐI KỲ MÔN HỌC 800702 NGUYỄN Thanh PHÚ 1810437

Định nghĩa
1.2.1

Uncertainty ( độ không chắc chắc)

“Uncertainty is that which disappears when we become certain”.(Bedford and
Cooke, 2001)
Sự không chắc chắn đề cập đến các tình huống khơng hồn hảo hoặc không xác
định. Điều này áp dụng cho các dự đoán về các sự kiện trong tương lai, cho các
phép đo vật lý đã được thực hiện hoặc chưa biết. Sự không chắc chắn phát sinh
trong bất kỳ lĩnh vực nào, Trong khoa học và kỹ thuật, sự chắc chắn đạt được
thông qua quan sát, và sự không chắc chắn l cái được loại bỏ bằng cách quan sát.
Do đó, trong những bối cảnh này, sự khơng chắc chắn có liên quan đến kết quả của
những quan sát có thể có.
1.2.2

Phép thử ( Random experiment)

Là một q trình dẫn đến một số (có thể là vơ hạn) các kết quả có thể xảy ra và kết
quả thực tế xảy ra phụ thuộc vào các ảnh hưởng không thể dự đốn trước. Một
phép thử thường được lặp lại nhiều lần.

Ví dụ: đo chiều cao, làm xét nghiệm, chẩn đoán bệnh hay điều trị bệnh,…l các
phép thử.
1.2.3

Không gian mẫu ( Outcome spaces hoặc Sample spaces)

Không gian mẫu Ω l tập hợp của tất cả kết quả có thể có của phép thử ngẫu nhiên.
Khơng gian mẫu hay khơng gian mẫu tồn thể, thường được ký hiệu là S, Ω
hay U (tức "universal set").
Ví dụ:

9/98


3/11/22, 10:20 PM

BÁO CÁO CUỐI KỲ MÔN HỌC 800702 NGUYỄN Thanh PHÚ 1810437

+Để nghiên cứu hiện tượng ngẫu nhiên về sự xuất hiện sấp hay ngửa khi tung một
đồng tiền, khơng gian mẫu của thí nghiệm đó l tập hợp Ω ={ngửa, sấp}
Đối với một số thí nghiệm, có thể có hai hoặc nhiều hơn khơng gian mẫu.
Ví dụ:
+Trong một cuộc đua ngựa, nếu chúng ta chỉ quan sát người chiến thắng, chúng ta
có thể lấy Ω = { tất cả số con ngựa trong cuộc đua} , khi chúng ta coi người chiến
thắng có thể là một trong những con ngựa có mặt ngy hơm đó.
+ Ngồi ra nếu chúng ta quan sát toàn bộ cuộc đua, chúng ta có thể lấy Ω = {thứ tự
xếp hạng có thể xảy ra}
1.2.4

Biến cố ( Events)


Các tập con của không gian mẫu được gọi là biến cố .

Hình 1. Minh họa tập hợp con
Dựa vào khả năng xuất hiện của hiện tượng chia các hiện tượng thành 3 loại.
A. Biến cố chắc chắn

10/98


3/11/22, 10:20 PM

BÁO CÁO CUỐI KỲ MÔN HỌC 800702 NGUYỄN Thanh PHÚ 1810437

Biến cố nhất định xảy ra sau phép thử gọi là biến cố chắc chắn, ký hiệu là Ω.
+ Ví dụ: Tung một con xúc sắc, gọi A là biến cố có số chấm nhỏ hơn hoặc bằng 6,
khi đó A l biến cố chắc chắn.
B. Biến cố trống
Biến cố nhất định không xảy ra sau phép thử gọi là biến cố khơng thể có ( biến cố
trống) , ký hiệu là Φ.
C. Biến cố ngẫu nhiên
Biến cố có thể xảy ra, cũng có thể xảy ra sau phép thử. Biến cố ngẫu nhiên thường
được ký hiệu bởi các chữ A, B, C,… hoặc các chữ số kèm theo chỉ số như A1, A2,
B1, B2, C1, C2, C3,…
+ Ví dụ: Nếu gọi Ai là biến cố con xúc sắc xuất hiện mặt có i chấm (i= 1,6 ) thì A1,
A2, A3, A4, A5,A6 là các biến cố ngẫu nhiên.
D. Biến cố bằng nhau

Biến cố A gọi là kéo theo biến cố B nếu A xảy ra thì B xảy ra , ký hiệu là A⊂B


Nếu đồng thời có A⊂B và B⊂A thì các biến cố A và B gọi là bằng nhau.(Huy,
2019)

Ví dụ: Tung một con xúc xắc. nếu gọi Ai là biến cố con xúc sắc xuất hiện mặt có i
chấm (i= 1,6 ), B là biến cố được số nút chia hết cho 3, C là biến cố được số nút
chẵn. P2 là biến cố được số nút nguyên tố chẵn. Khi đó ta có
A2⊂C, A3⊂B

A2⊂P2, P2⊂A2, A2=P2

Từ các định nghĩa, với mọi biến cố A ta có : A⊂Ω, Ω⊂A

11/98


3/11/22, 10:20 PM

BÁO CÁO CUỐI KỲ MÔN HỌC 800702 NGUYỄN Thanh PHÚ 1810437

Do các quan hệ này nên ta có: Các biến cố trống đều bằng nhau và các biến cố
chắc chắn đều bằng nhau.
E. Quan hệ giữa các biến cố
Cho hai biến cố A và B . Khi đó ta gọi:
i.

Tổng của A và B, hay A cộng B

Là biến cố xảy ra khi A xảy ra hoặc B xảy ra, ký hiệu A+B.
ii.


Tích của A và B, hay A nhân B,

Là biến cố xảy ra nếu A v B đồng thời xảy ra, ký hiệu A.B hoặc AB.
iii.

Hiệu của A và B, hay A trừ B

Là biến cố xảy ra nếu A xảy ra nhưng B không xảy ra, ký hiệu A-B.
iv.

Biến cố xung khắc

Hai biến cố A và B gọi là xung khắc nếu chúng không thể đồng thời xảy ra sau
phép thử. Nói cách khác nếu biến cố A đã xảy ra thì biến cố B không xảy ra và
ngược lại, hoặc cả hai biến cố A và B đều không xảy ra sau phép thử.
Như vậy, nếu A và B là hai biến cố xung khắc thì A.B = Φ
+Ví dụ . Tung một con xúc xắc, gọi A là biến cố: “Xuất hiện mặt có chấm số chấm
lớn hơn hoặc bằng 4”, B l biến cố: “Xuất hiện mặt có chấm số chấm nhỏ hơn hoặc
bằng 2”.
Ta thấy hai biến cố và không cùng xảy ra, do đó A v B l hai biến cố xung khắc.
v.

Đôi một xung khắc

12/98


3/11/22, 10:20 PM

BÁO CÁO CUỐI KỲ MÔN HỌC 800702 NGUYỄN Thanh PHÚ 1810437


Các biến cố A1,A2,…An gọi l đôi một xung khắc nếu hai biến cố khác nhau bất kỳ
trong đó dều là xung khắc, tức là:

+Ví dụ: Tung một con xúc sắc

Ai.Aj=Φ với mọi i≠j

Gọi: Ai = {con xúc sắc xuất hiện mặt có i chấm} (i = 1,6 ) thì A1 và A2 là hai biến
cố xung khắc, A1 và A6 là hai biến cố xung khắc...., A5 và A6 là 2 biến cố xung
khắc, vậy A1, A2, A3, A4, A5, A6 là một hệ gồm 6 biến cố xung khắc từng đôi.
Biến cố đối lập

vi.

Biến cố đối lập của A là biến cố xảy ra nếu A không xảy ra và không xảy ra nếu A
xảy ra, ký hiệu 𝐴 hoặc 𝐴𝑐 . Nếu A và 𝐴 là 2 biến cố đối lập thì A + 𝐴 = Ω v A. 𝐴


+ Ví dụ: Một bà mẹ sinh con, biến cố sinh con trai và biến cố sinh con gái là biến
cố đối lập.
vii.

Nhóm đầy đủ các biến cố

Các biến cố A1,A2,…An gọi l nhóm đầy đủ các biến cố nếu chúng đơi một xung
khắc và ít nhất một trong chúng chắc chắn xảy ra , tức là:
𝐴 . 𝐴 = 𝛷 với mọi i ≠ j
{ 𝑖 𝑗
𝐴1 + 𝐴2 + ⋯ + 𝐴𝑛 = Ω


+ Ví dụ với mọi biến cố A, hai biến cố A, 𝐴 là một nhóm đầy đủ các biến cố.
F. Các phép toán tập hợp
i.

Phép giao

13/98


3/11/22, 10:20 PM

BÁO CÁO CUỐI KỲ MÔN HỌC 800702 NGUYỄN Thanh PHÚ 1810437

Giao của hai tập hợp A và B, kí hiệu A ∩ B l tập hợp gồm các phần tử thuộc A và
B, là biến cố xảy ra khi A và B cùng xảy ra.

Hình 2. Biểu đồ Venn thể hiện phép giao
ii.

Phép hợp

Hợp của hai tập hợp A và B, kí hiệu A ∪ B là tập hợp gồm các phần tử thuộc A

hoặc thuộc B, là biến cố xảy ra khi A xảy ra hoặc B xảy ra hoặc A và B cùng xảy
ra.

Hình 3. Biểu đồ Venn thể hiện phép hợp
iii.


Định luật DeMorgan

14/98


3/11/22, 10:20 PM

BÁO CÁO CUỐI KỲ MÔN HỌC 800702 NGUYỄN Thanh PHÚ 1810437

Cho hai tập hợp bất kì A và B thì
( A∩ B )C = AC U BC
( AU B )C = AC ∩ BC
+ Ví dụ : Rút gọn biểu thức sau sử dụng định luật DeMorgan: 𝑌 = 𝐴𝐵 + 𝐴𝐵
Giải: 𝑌 = 𝐴𝐵 + 𝐴𝐵 = 𝐴𝐵. 𝐴𝐵

Trong đó : 𝐴𝐵 = 𝐴 + 𝐵 = 𝐴 + 𝐵 𝑣à 𝐴𝐵 = 𝐴 + 𝐵 = 𝐴 + 𝐵
 𝑌 = 𝐴𝐵 + 𝐴𝐵 = 𝐴𝐵. 𝐴𝐵 = (𝐴 + 𝐵). (𝐴 + 𝐵 )

= 𝐴. 𝐴 + 𝐴. 𝐵 + 𝐵. 𝐴 + 𝐵. 𝐵 = 0 + 𝐴. 𝐵 + 𝐵. 𝐴 + 0 = 𝐴. 𝐵 + 𝐵. 𝐴

1.3 Xác suất

A. Định nghĩa theo suy luận Frequentist:
Định nghĩa theo suy luận Frequentist của xác suất là cách giải thích điển hình của
xác suất bởi nhà thực nghiệm. Theo cách hiểu này, xác suất P (A) chỉ đơn giản là
tần suất xuất hiện tương đối của sự kiện A như được quan sát trong một thí nghiệm
với n thử nghiệm, tức là xác suất của một sự kiện A được xác định là số lần sự kiện
A xảy ra chia cho số thử nghiệm được thực hiện:(M.H.Faber, 2012)
𝑃(𝐴) = lim


𝑁𝐴
𝑣ớ𝑖 𝑛𝑒𝑥𝑝 → ∞
𝑛𝑒𝑥𝑝

Trong đó 𝑁𝐴 là số lần biến cố A xảy ra, 𝑛𝑒𝑥𝑝 là tổng số lần thử nghiệm.

+ Ví dụ: Theo suy luận Frequentist, khi đưa ra xác suất để đạt mặt ngửa khi tung
đồng xu, kết quả sẽ khơng có. Ngoại trừ, khi đã nhận được thêm dữ liệu là sau

15/98


3/11/22, 10:20 PM

BÁO CÁO CUỐI KỲ MÔN HỌC 800702 NGUYỄN Thanh PHÚ 1810437

1000 lần tung, thì đạt được mặt ngửa là 563 lần thì câu trả lời là xác suất sẽ là
0.563 khi tung ra được mặt ngửa. Tuy nhiên khi tiếp tục tung thì xác suất sẽ dần về
0.5, khi đó ta có nhiều kết quả , rất khó trong việc đưa ra quyết định.Theo định
nghĩa xác suất của Frequentist , chỉ những sự kiện ngẫu nhiên lặp đi lặp lại (như
kết quả của việc tung một đồng xu) mới có xác suất. Trường phái Frequentist phủ
định việc gắn xác suất với các giả thuyết hoặc với bất một giá trị cố định m chưa
biết trước.(Thống kê suy luận – Hai trường phải triết học, 2019)
B. Định nghĩa cổ điển
Định nghĩa xác suất cổ điển bắt nguồn từ những ngày mà phép tính xác suất được
thành lập bởi Pascal và Fermat(Alsalam, 1998). Giả sử phép thử có n trường hợp
đồng khả năng, trong số đó có m trường hợp thuận lợi cho biến cố A. khi đó ta gọi
xác suất của biến cố A là:(Huy, 2019)
𝑃(𝐴) =


𝑚
𝑛

Như vậy, xác suất của biến cố A là tỷ số về khả năng biến cố xuất hiện.
+Ví dụ:
Tung một đồng tiền cân đối, đồng chất. Gọi S là biến cố được mặt sấp, N là biến cố
được mặt ngửa. Ta có P(S) = ½, P(N) =1/2
Trên thực tế, khơng có mâu thuẫn thực sự với suy luận Frequentist, nhưng có thể
nhận thấy những khác biệt sau:
• Thí nghiệm khơng cần tiến hnh vì đã biết trước câu trả lời.
C. Định nghĩa theo suy luận Bayesian
Các suy diễn từ Bayesian cho phép ta cập nhật những suy diễn xác suất khi thay
đổi niềm tin con người, các chứng cứ và thông tin từ dữ liệu:

16/98


3/11/22, 10:20 PM

BÁO CÁO CUỐI KỲ MÔN HỌC 800702 NGUYỄN Thanh PHÚ 1810437

P(A)= mức độ “niềm tin” m biến cố A xảy ra
Mức độ niềm tin là sự phản ánh trạng thái tâm trí của cá nhân về kinh nghiệm,
chuyên mơn và sở thích.(M.H.Faber, 2012)
Trái ngược với suy luận theo Frequentist, Bayesian l trường phái tạo ra sự linh
hoạt trong đo lường khả năng xảy ra của biến cố, nơi m chúng ta có thể thay đổi
xác suất theo kinh nghiệm một cách linh hoạt thay vì những sự thật tần suất khô
khan(Khanh, 2021). Ưu điểm của trường phái Bayesian đó l hoạt động hiệu quả
hơn trong các tác vụ dự báo với kích thước mẫu nhỏ.
+ Ví dụ: Tung một đồng tiền cân đối, đồng chất. Gọi S là biến cố được mặt sấp, N

là biến cố được mặt ngửa.Ban đầu bạn thực hiện 3 lần tung v thu được kịch bản là
[S,N,N].
 Theo trường phái Frequentist, Ở lượt tung thứ 4 có q ít bằng chứng để bạn
tin rằng xác suất mặt sấp là 1/3, vì lý do số lượt tung quá ít v đồng xu là
đồng chất.
 Bạn vẫn có niềm tin về tỷ lệ xác suất là cân bằng giữa hai mặt dựa trên phân
tích lý trí rằng đồng xu l đồng chất nên mặt sấp và mặt ngửa có vai trị bình
đẳng. Tổng xác suất của mặt ngửa và mặt xấp là 1 nên xác suất mỗi mặt sẽ là
1/2. Khi đưa ra phỏng đoán về lượt tung thứ 4 bạn không tin xác suất sẽ là
1/3 là một sự thật mà tin vào lý trí khi cho rằng xác suất là 1/2. Đây l suy
luận theo Bayeasian.
D. Định nghĩa xác suất theo tiên đề
Ký hiệu A là tập hợp các biến cố trong một phép thử. Ta gọi xác suất là một quy
tắc đặt mỗi A∈A (Ghahramani, 1999)
(I)

0 ≤ 𝑃(𝐴) ≤ 1, 𝐴 ∈ 𝑨

17/98


3/11/22, 10:20 PM

BÁO CÁO CUỐI KỲ MÔN HỌC 800702 NGUYỄN Thanh PHÚ 1810437

(II) 𝑃(Ω) = 1, 𝑃(𝛷) = 0
(III) Với mội dãy biến cố đôi một xung khắc (An)⊂A


𝑃 (∑ 𝐴𝑖

𝑖=1



) = ∑ 𝑃(𝐴𝑖 )
𝑖=1

Tiên đề (I) : Tiên đề xác suất đầu tiên là xác suất của bất kỳ sự kiện nào là một số
thực không âm. Điều ny có nghĩa là xác suất nhỏ nhất có thể là 0 và nó khơng thể
là vơ hạn. Bộ số mà chúng ta có thể sử dụng là số thực. Điều ny đề cập đến cả số
hữu tỉ, còn được gọi là phân số và số vô tỉ không thể được viết dưới dạng phân số.
Một điều cần lưu ý l tiên đề này khơng nói gì về xác suất của một sự kiện có thể
lớn như thế no. Tiên đề loại trừ khả năng xảy ra các xác suất âm. Nó phản ánh
quan điểm rằng xác suất nhỏ nhất, dành riêng cho các sự kiện không thể xảy ra,
bằng không.
Tiên đề (II) : Tiên đề thứ hai về xác suất là xác suất của tồn bộ khơng gian mẫu là
một. Nói một cách hình tượng, chúng ta viết P ( A) = 1. Ngụ ý trong tiên đề này là
khái niệm rằng khơng gian mẫu là mọi thứ có thể cho thí nghiệm xác suất của
chúng ta và rằng khơng có sự kiện nào bên ngồi khơng gian mẫu.
Tự nó, tiên đề ny không đặt giới hạn trên về xác suất của các sự kiện khơng phải
là tồn bộ khơng gian mẫu. Nó phản ánh rằng một cái gì đó chắc chắn tuyệt đối có
xác suất là 100%.
Tiên đề (III) :Tiên đề thứ ba về xác suất đề cập đến các sự kiện loại trừ lẫn
nhau. Tiên đề thứ ba cho rằng đối với một chuỗi các sự kiện loại trừ lẫn nhau, xác
suất xuất hiện của ít nhất một trong số chúng bằng tổng xác suất của chúng.
Mặc dù tiên đề thứ ba này có vẻ khơng hữu ích cho lắm, nhưng chúng ta sẽ thấy
rằng kết hợp với hai tiên đề kia, nó thực sự khá mạnh mẽ.

18/98



3/11/22, 10:20 PM

BÁO CÁO CUỐI KỲ MÔN HỌC 800702 NGUYỄN Thanh PHÚ 1810437

1.4 Các phép tính xác suất
1.4.1

Xác suất của biến cố đối lập

Với mọi biến cố A, ta có 𝑃(𝐴) = 1 − 𝑃(𝐴)
Chứng minh : Ta có theo tiên đề III và I

P((𝐴 + 𝐴) = 𝑃(𝐴) + 𝑃(𝐴) 𝑚à 𝑃(𝐴 + 𝐴) = 𝑃(Ω) => 𝑃(𝐴 + 𝐴) = 1

+Ví dụ: Tung 2 con xúc xắc. Ta có khơng gian mẫu Ω = {(𝑖, 𝑗): 1 ≤ 𝑖 ≤ 6, 1 ≤
𝑗≤ 6}

Gọi A là biến cố tổng hai mặt bằng 4 => A={(1.3), (2,2), (3,1)}
 P(A)=3/36.

Sẽ rất khó để đếm đủ trường hợp sẽ ra hai mặt có tổng khác 4. Theo định lý của
biến cố đối lặp, P(Ac)=1-3/36=33/36
1.4.2

Định lý cộng xác suất

 Nếu A1,A2,…An là các biến cố đơi một xung khắc thì

𝑃(𝐴1 + 𝐴2 + ⋯ + 𝐴𝑛 ) = 𝑃(𝐴1 ) + 𝑃(𝐴2 ) + ⋯ + 𝑃(𝐴𝑛 )


 Với các biến cố tùy ý A và B, ta có:

Chứng minh:

𝑃(𝐴 + 𝐵 ) = 𝑃(𝐴) + 𝑃 (𝐵) − 𝑃(𝐴. 𝐵)

Giả sử trong n trường hợp đồng khả năng có thể xảy ra của phép thử:
+ Có m1 trường hợp thuận lợi cho việc xuất hiện của biến cố A, tức là: P(A)=m1/n
+ Có m2 trường hợp thuận lợi cho việc xuất hiện của biến cố B, tức là: P(B) =m2/n

19/98


3/11/22, 10:20 PM

BÁO CÁO CUỐI KỲ MÔN HỌC 800702 NGUYỄN Thanh PHÚ 1810437

+ Có m trường hợp thuận lợi cho việc xuất hiện cả biến cố A và B, tức là có m
trường hợp thuận lợi cho việc xuất hiện biến cố tích A.B. Do đó P(A.B) =m.n
khi đó số trường hợp thuận lợi cho việc xuất hiện của biến cố tổng (A + B) là:
(m1 + m2 – m).
m1 + m2 – m
𝑛

Vì vậy P(A+B) =

= 𝑃(𝐴 + 𝐵 ) = 𝑃(𝐴) + 𝑃 (𝐵) − 𝑃(𝐴. 𝐵)

+Ví dụ: Có 400 người trong 1 sự kiện. Trong đó 300 người tham gia đạp xe hoặc

bơi , 160 người bơi v 120 người bơi v đạp xe. Xác suất để chọn ra người tham
gia bơi.
Giải: Gọi A là biến cố người tham gia bơi,B là biến cố người tham gia đạp xe.
Khi đó A+B là biến cố người tham gia đạp xe hoặc bơi
Ta có P(A+B)=300/400, P(A)=160/400, P(AB) =120/400.
Theo định lý: P(B) = P(A+B)+P(AB) –P(A)
= 300/400+120/400-160/400=260/400=0.65
1.4.3

Định lý nhân xác suất

A. Xác suất có điều kiện
Cho hai biến cố A và B. Ta gọi xác suất của biến cố A khi biến cố B đã xảy ra là
xác suất của A với điều kiện B, ký hiệu P(A/B)
+Ví dụ: Giả sử 1 lớp chia làm 3 nhóm thực tập. Nhóm I có 30 sinh viên trong đó
có 10 nữ, nhóm II có 25 sinh viên trong đó có 10 nữ, nhóm III có 25 sinh viên
trong đó có 8 nữ. Chọn ngẫu nhiên trong lớp ra một sinh viên, tìm xác suất để đó l
sinh viên nữ thuộc nhóm 2?

20/98


3/11/22, 10:20 PM

BÁO CÁO CUỐI KỲ MÔN HỌC 800702 NGUYỄN Thanh PHÚ 1810437

Giải: Gọi B là biến cố sinh viên chọn ra là nữ
A là biến cố sinh viên thuộc nhóm 2
 P(B/A) = 0,4
B. Biến cố độc lập

Hai biến cố A v B đọc lập nếu xác suất của biến cố này không phụ thuộc vào sự
xảy ra hay không xảy ra của biến cố kia, tức là :

𝑃(𝐴 /𝐵) = 𝑃(𝐴) 𝑣à 𝑃(𝐵 /𝐴) = 𝑃(𝐵)

+ Ví dụ: Khi tung 2 đồng xu, rõ rng đồng xu này có xuất hiện mặt sấp hay khơng,
cũng khơng ảnh hưởng tới xác suất để đồng xu kia xuất hiện mặt sấp (hay ngửa).
Như vậy, việc bà mẹ ny sinh con trai hay không, cũng không ảnh hưởng tới xác
suất sinh con trai (gái) của bà mẹ khác. Ta đã nhận biết đưuọc các biến cố vừa xét
l độc lập.
C. Định lý nhân xác suất
i.

Với các biến cố tùy ý A và B, ta có:

Chứng minh:

𝑃(𝐴𝐵) = 𝑃(𝐴). 𝑃(𝐴 /𝐵) = 𝑃(𝐴). 𝑃(𝐵 /𝐴)

Giả sử:n là số kết quả có thể có khi thực hiện phép thử,m1 là số trường hợp thuận
lợi cho biến cố A xảy ra ,m2 là số trường hợp thuận lợi cho biến cố B xảy ra, m là
số trường hợp thuận lợi cho cả biến cố A và B xảy ra
khi đó P(A.B) =m/n v P(A)=m1.n

21/98


3/11/22, 10:20 PM

BÁO CÁO CUỐI KỲ MÔN HỌC 800702 NGUYỄN Thanh PHÚ 1810437


Ta đi tìm P(B/A), với điều kiện biến cố A đã xảy ra rồi thì số kết cục duy nhất
đồng khảnăng của phép thử đối với biến cố B l m1 , trong đó m l kết cục thuận
lợi cho biến cố B xảy ra.
𝑚/𝑛
1 /𝑛

Khi đó theo định nghĩa ta có: P(B/A) =m/m1=𝑚

= P(A. B)/P(A)

Vậy p(A.B) = p(A).p(B/A)
Hon ton tương tự ta cũng có thể chứng minh được p(A.B) = p(B).p(A/B)
+ Ví dụ:
Một tập gồm 10 chứng từ, trong đó có 2 chứng từ khơng hợp lệ. Một cán bộ kế
toán rút ngẫu nhiên 1 chứng từ và tiếp đó rút ngẫu nhiên 1 chứng từ khác để kiểm
tra.
a. Tính xác suất để cả 2 chứng từ rút ra đều hợp lệ.
b. Nếu người đó rút chứng từ thứ ba. Tính xác suất để trong chứng từ rút ra chỉ có
chứng từ thứ 3 khơng hợp lệ.
Giải: Gọi A = {cả 2 chứng từ rút ra đều hợp lệ}.
B = {trong 3 chứng từ rút ra, chỉ có chứng từ thứ 3 khơng hợp lệ}
Nếu gọi Ai = {chứng từ rút ra lần thứ i là hợp lệ} (i = 1,3). Khi đó ta có :
A = A1 . A2 và B = A1 . A2 . A3
Vì vậy các xác suất cần tìm là:
P(A) = P(A1 . A2) = P(A1). P(A2/ A1) =10 . 9 = 45
8

7


28

.

22/98


3/11/22, 10:20 PM

BÁO CÁO CUỐI KỲ MÔN HỌC 800702 NGUYỄN Thanh PHÚ 1810437

P(B) = P(A1 . A2 . A3) = P(A1). P(A2/A1) . P( 𝐴3 /A1 . A2)= . 7 . 2 =
10 9 8
ii.
Hệ quả
8

45
7

Nếu A và B là hai biến cố độc lập:

Tổng quát:

𝑃(𝐴𝐵) = 𝑃(𝐴). 𝑃(𝐵)

 Nếu trong một phép thử, các biến cố A1, A2, …, An có thể cùng xảy ra thì:
P(A1. A2. …. An) = P(A1).P( A2/A1)….P(An/A1. A2. …. An-1).
 Nếu các biến cố A1, A2, …, Ak độc lập thì:
P(A1. A2. …. An) = P(A1).P( A2)….P(An)

+ Ví dụ:
Một cơng nhân đứng hai máy hoạt động độc lập nhau. Xác suất để máy thứ nhất,
máy thứ 2 không bị hỏng trong một ca làm việc lần lượt là 0,9 và 0,8. Tính xác
suất để cả 2 máy đều không bị hỏng trong một ca làm việc.
Giải:
Gọi A = {cả 2 máy đều không bị hỏng trong một ca làm việc}
Nếu gọi Ai = { máy thứ i không bị hỏng trong một ca làm việc} (i =1,2), khi đó ta
có: A = A1.A2
Vì vậy xác suất cần tìm là: P(A) = p(A1.A2)
Theo giả thiết A1, A2 là 2 biến cố độc lập với nhau nên ta có:
P(A) = P(A1.A2) = P(A1).P(A2) = 0,72

23/98


3/11/22, 10:20 PM

BÁO CÁO CUỐI KỲ MÔN HỌC 800702 NGUYỄN Thanh PHÚ 1810437

CHƯƠNG 2. BIẾN NGẪU NHIÊN RỜI RẠC
2.1 Biến ngẫu nhiên rời rạc
2.1.1

Định nghĩa

A. Biến ngẫu nhiên
Giả sử A1,A2,…An là một nhóm đầy đủ các biến cố. Khi đó có một quy tắc X đặt
mỗi biến cố Ai với một số xi(i=1, 𝑛) gọi là một đại lượng ngẫu nhiên. Đại lượng
ngẫu nhiên còn gọi là biến ngẫu nhiên. (Huy, 2019)
+ Ví dụ:

Tung một con xúc xắc. Gọi X là số nút xuất hiện. Khi đó X l đại lượng ngẫu
nhiên. Tập giá trị của X là {1,2,3,4,5,6} nên ta thờng viết:
X={1,2,3,4,5,6}
B. Biến ngẫu nhiên rời rạc (Discrete random variables)
Là biến ngẫu nhiên mà giá trị có thể có của nó lập thành một tập hợp hữu hạn hoặc
đếm được các giá trị. Nói cách khác, ta có thể liệt kê tất cả các giá trị của biến ngẫu
nhiên đó.
+Ví dụ:
Tung một đồng tiền cho đến khi được mặt ngửa thì dừng. Gọi X là số lần tung. Khi
đó X l đại lượng ngẫu nhiên:
X={1,2,…,n}
Đại lượng ngẫu nhiên có dạng:
X={x1,x2,…,xn,…}

24/98


3/11/22, 10:20 PM

BÁO CÁO CUỐI KỲ MÔN HỌC 800702 NGUYỄN Thanh PHÚ 1810437

Các đại lượng này có các giá trị rời nhau, gọi l đại lượng ngẫu nhiên rời rạc.
2.1.2

Các đặc trưng của biến ngẫu nhiên rời rạc

A. Kỳ vọng (Expectation)
i.

Kỳ vong được sử dụng đầu tiên bởi Pascal nhưng sau ny được phổ biến và

trình bày bởi Huygens vào cuối thế kỉ thứ 17.

Cho X l đại lượng ngẫu nhiên rời rạc nhận một trong các giá trị có thể có
x1,x2,…,xn với xác suất tương ứng p1, p2,…pn thì ky vọng của X, ký hiệu là E(X)
được tính theo công thức:

𝜇 =E(X)= x1p1+x2p2+….+xnpn+….=∑ ∞
𝑛=1 𝑥𝑛 𝑝𝑛

Vậy: Kỳ vọng của đại lượng ngẫu nhiên là trung bình theo xác suất các giá trị có
thể nhận cảu đại lượng ngẫu nhiên đó. E(X) l một giá trị trung bình của các xi,
mỗi xi được tính với tỷ trọng pi
+Ví dụ thực tế:(Ghahramani, 1999)
Trong một ván bài casino, xác suất thua 1$ mỗi ván là 0.6, xác suất thắng 1 $, 2$
và 3$ mỗi ván lần lượt là 0.3, 0.08 và 0.02.
Thực tế cho thấy, nếu người chơi chỉ đánh ít ván, người đó phụ thuộc vào may mắn
của mình nhiều hơn bất kỳ kĩ năng no. Chẳng hạn, khi chơi 1 ván, người đó có thể
thắng 3$ trong khi đang có 60% tỷ lệ thua 1$.
Tuy nhiên , khi chơi nhiều ván, thì tỷ lệ chiến thắng sẽ phụ thuộc vào số lần chơi
nhiều hơn l may mắn. Gọi n là số ván chơi. Xác suất lần lượt là 0.6n cho lần thua
1$; 0.3n,0.08n và 0.02n cho lần thắng 1$, 2$ và 3$.

Ta có: 0.6𝑛 × (−1) + 0.3𝑛 × 1 + 0.08𝑛 × 1 + 0.02𝑛 × 1 = −0.08𝑛

25/98


×