Tải bản đầy đủ (.pdf) (98 trang)

BÁO cáo CUỐI kỳ môn học PHÂN TÍCH dữ LIỆU 800702 (VP HK211)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.4 MB, 98 trang )

lOMoARcPSD|2935381

TRƯỜNG ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC BÁCH KHOA THÀNH PHỐ HỒ CHÍ MINH
CHƯƠNG TRÌNH KỸ SƯ CHẤT LƯỢNG CAO VIỆT PHÁP


PHÂN TÍCH DỮ LIỆU

GIẢNG VIÊN HƯỚNG DẪN:

SINH VIÊN THỰC HIỆN:

Trần Nguyễn Ngọc Cương

Nguyễn Thanh Phú-1810437

TP HỒ CHÍ MINH, 2021

Downloaded by EBOOKBKMT VMTC ()


lOMoARcPSD|2935381

BÁO CÁO CUỐI KỲ MƠN HỌC
PHÂN TÍCH DỮ LIỆU (800702(VP_HK211)
HỌ VÀ TÊN: NGUYÊN THANH PHÚ
MÃ SỐ SV: 1810437
GMAIL:
SĐT:0949901937
Tôi không thảo luận với bất kỳ ai về nội dung báo cáo



Downloaded by EBOOKBKMT VMTC ()


lOMoARcPSD|2935381

Phụ lục
CHƯƠNG 1. LÝ THUYẾT XÁC SUẤT ...............................................................8
1.1 Lịch sử xác suất thông kê ..............................................................................8
1.1.1

Trong thực tế ........................................................................................8

1.1.2

Trong xây dựng ....................................................................................8

1.2 Định nghĩa .....................................................................................................9
1.2.1

Uncertainty ( độ không chắc chắc) ......................................................9

1.2.2

Phép thử ( Random experiment) ..........................................................9

1.2.3

Không gian mẫu ( Outcome spaces hoặc Sample spaces) ...................9


1.2.4

Biến cố ( Events) ................................................................................10

A. Biến cố chắc chắn ..................................................................................10
B. Biến cố trống ..........................................................................................11
C. Biến cố ngẫu nhiên.................................................................................11
D. Biến cố bằng nhau ..................................................................................11
E. Quan hệ giữa các biến cố .......................................................................12
F. Các phép toán tập hợp............................................................................13
1.3 Xác suất .......................................................................................................15
A. Định nghĩa theo suy luận Frequentist: .....................................................15
B.

Định nghĩa cổ điển ...................................................................................16

C.

Định nghĩa theo suy luận Bayesian ..........................................................16

D. Định nghĩa xác suất theo tiên đề ..............................................................17
1.4 Các phép tính xác suất .................................................................................19

Downloaded by EBOOKBKMT VMTC ()


lOMoARcPSD|2935381

1.4.1 Xác suất của biến cố đối lập.....................................................................19
1.4.2


Định lý cộng xác suất.........................................................................19

1.4.3 Định lý nhân xác suất ...............................................................................20
A. Xác suất có điều kiện ...............................................................................20
B.

Biến cố độc lập .........................................................................................21

C.

Định lý nhân xác suất ...............................................................................21

CHƯƠNG 2. BIẾN NGẪU NHIÊN RỜI RẠC ....................................................24
2.1 Biến ngẫu nhiên rời rạc ...............................................................................24
2.1.1

Định nghĩa ..........................................................................................24

A. Biến ngẫu nhiên .....................................................................................24
B. Biến ngẫu nhiên rời rạc (Discrete random variables) ............................24
2.1.2

Các đặc trưng của biến ngẫu nhiên rời rạc ........................................25

A. Kỳ vọng (Expectation) ...........................................................................25
B. Phương sai ( Variance) ..........................................................................26
C. Độ lệch chuẩn (Standard deviation).......................................................28
D. Trung vị ..................................................................................................28
E. Moment trung tâm (mơ-men) ................................................................28

F. Biến ngẫu nhiên chuẩn hóa (Standardized random variables) ..............29
2.1.3 Hàm và phân phối của biến ngẫu nhiên rời rạc........................................30
A. Hàm khối xác suất ( Probrability mass function).....................................30
B. Hàm phân phối xác suất .........................................................................31
C. Phân phối Bernoulli ...............................................................................33

Downloaded by EBOOKBKMT VMTC ()


lOMoARcPSD|2935381

D. Phân phối nhị thức (Binomial distribution) ...........................................34
E. Phân phối hình học.................................................................................35
F. Phân phối Poisson ..................................................................................36
CHƯƠNG 3. BIẾN NGẪU NHIÊN LIÊN TỤC ..................................................39
3.1 Biến ngẫu nhiên liên tục ..............................................................................39
3.1.1

Định nghĩa ..........................................................................................39

A. Biến ngẫu nhiên liên tục ........................................................................39
B. Hàm mật độ xác suất (Probability density function) .............................39
3.1.2

Các đặc trưng của biến ngẫu nhiên liên tục .......................................41

A. Kỳ vọng ..................................................................................................41
B. Phương sai ..............................................................................................41
3.2 Các phân phối liên tục .................................................................................41
3.2.1


Phân phối đều.....................................................................................41

3.2.2

Phân phối mũ (Exponential Distribution) ..........................................43

3.2.3

Phân phối chuẩn (Normal Distribution) ............................................44

A. Phân phối chuẩn .....................................................................................44
B. Phân phối chuẩn chuẩn tắc.....................................................................46
C. Tích phân Laplace ..................................................................................47
D. Cơng thức tính xác suất..........................................................................47
3.2.4

Phân phối Chi-Bình phương( Chi-Squared) ......................................49

3.2.5

Phân phối Student ..............................................................................51

3.3 Hệ số Z của Altman .....................................................................................52

Downloaded by EBOOKBKMT VMTC ()


lOMoARcPSD|2935381


3.3.1

Giới thiệu ...........................................................................................52

3.3.2

Công thức ...........................................................................................53

CHƯƠNG 4. KIỂM ĐỊNH GIẢ THIẾT ..............................................................54
4.1 Khái niệm ....................................................................................................54
4.1.1

Giả thiết không (Null Hypothesis) .....................................................54

4.1.2

Giả thiết nghịch (Alternative hypothesis) ..........................................54

4.1.3

Mức ý nghĩa .......................................................................................55

4.1.4

Miền bác bỏ........................................................................................55

4.1.5

Kiểm định giả thiêt thông kê..............................................................55


4.2 Kiểm định giả thiết tham số ........................................................................57
4.2.1

Kiểm định giá trị kì vọng của phân phối chuẩn .................................57

4.2.2

Kiểm định so sánh hai trung bình ......................................................62

4.2.3

Kiểm định phương sai ........................................................................64

A. Kiểm định phương sai (A chi-square test) .............................................64
B. So sánh phương sai ( F-test) ..................................................................66
4.2.4

Kiểm định tỷ lệ...................................................................................68

A. Kiểm định giải thiết về tỷ lệ tổng thể ....................................................68
B. Kiểm định so sánh hai tỷ lệ ....................................................................69
4.3 Kiểm định giả thiết phi tham số ..................................................................70
4.3.1

Kiểm định quy luật phân phối (Chi-Square Goodness-of-Fit Test) ..70

A. Trường hợp khơng có những tham số chưa biết ....................................70
B. Trường hợp có những tham số chưa biết ...............................................72

Downloaded by EBOOKBKMT VMTC ()



lOMoARcPSD|2935381

4.4 Kiểm định tính độc lập (Contingency table) ...............................................73
4.4.1

Bảng tương quan ................................................................................73

4.4.2

Kiểm định Chi-Squared về tính độc lập (Chi-square test of

independence) ..................................................................................................74
CHƯƠNG 5. QUY HOẠCH TUYẾN TÍNH .......................................................77
5.1 Định nghĩa quy hoạch tuyến tính ................................................................77
5.2 Sự tồn tại nghiệm và tính chất tập nghiệm quy hoạch tuyến tính ...............78
5.2.1

Sự tồn tại nghiệm ...............................................................................78

5.2.2

Tính chất tập nghiệm .........................................................................82

5.3 Giải bài tốn quy hoạch tuyến tính hai biến bằng phương pháp hình học ..83
5.4 Phương pháp đơn hình ................................................................................88
5.4.1

Thuật tốn đơn hình dạng bảng(Kim, 2008) .....................................89


Tài liệu tham khảo....................................................................................................97

Downloaded by EBOOKBKMT VMTC ()


lOMoARcPSD|2935381

CHƯƠNG 1. LÝ THUYẾT XÁC SUẤT
1.1

Lịch sử xác suất thông kê
1.1.1

Trong thực tế

Sau sự thiên tài của nhà toán học người Nga Xô Viết Andrei Kolmogorov(Mai,
2016), lý thuyết xác suất đã trở thành một nhánh toán học chặt chẽ cung cấp cơ sở
cho việc nghiên cứu các quá trình ngẫu nhiên, phép tính ngẫu nhiên và nhiều lý
thuyết tốn học được sử dụng để hiểu ngẫu nhiên hệ thống cung cấp các ý tưởng và
công cụ mới để chứng minh toán học các định lý trong các lĩnh vực lý thuyết số, tổ
hợp, phương trình vi phân và vi phân hình học.
1.1.2

Trong xây dựng

Lý thuyết xác suất là nền tảng của thống kê. Có rất nhiều ứng dụng của xác suất
trong xã hội. Ví dụ, chúng ta cần sử dụng lý thuyết xác suất trong các lĩnh vực
khác nhau như kế tốn, tài chính, thiết kế tổ chức và quản lý nguồn nhân lực và đặc
biệt trong ngành xây dựng là đưa ra quyết định trong những điều kiện không chắc

chắn.
Điều quan trọng là phải nhận ra rằng những thứ khác nhau có thể xảy ra sai sót
trong q trình khác nhau bao gồm các sự kiện như sai sót và lỗi trong quá trình
thiết kế, các hư hỏng và tai nạn trong quá trình xây dựng, vận hành . Các nguyên
nhân tiềm ẩn , sai lầm, hỏng hóc và tai nạn có thể rất nhiều, bao gồm cả lỗi của con
người, hư hỏng của các bộ phận kết cấu, các tình huống tải trọng khắc nghiệt và
khơng kém phần các mối nguy hiểm của môi trường tự nhiên . Lập kế hoạch cẩn
thận trong giai đoạn đầu của dự án là cách duy nhất để kiểm soát các rủi ro liên
quan đến các sự kiện đó.
Tóm lại, phần quan trọng nhất của lý thuyết xác suất là nghiên cứu về độ không
chắc chắn.

Downloaded by EBOOKBKMT VMTC ()


lOMoARcPSD|2935381

Định nghĩa

1.2

1.2.1

Uncertainty ( độ không chắc chắc)

“Uncertainty is that which disappears when we become certain”.(Bedford and
Cooke, 2001)
Sự không chắc chắn đề cập đến các tình huống khơng hồn hảo hoặc khơng xác
định. Điều này áp dụng cho các dự đốn về các sự kiện trong tương lai, cho các
phép đo vật lý đã được thực hiện hoặc chưa biết. Sự không chắc chắn phát sinh

trong bất kỳ lĩnh vực nào, Trong khoa học và kỹ thuật, sự chắc chắn đạt được
thông qua quan sát, và sự không chắc chắn là cái được loại bỏ bằng cách quan sát.
Do đó, trong những bối cảnh này, sự khơng chắc chắn có liên quan đến kết quả của
những quan sát có thể có.
1.2.2

Phép thử ( Random experiment)

Là một quá trình dẫn đến một số (có thể là vơ hạn) các kết quả có thể xảy ra và kết
quả thực tế xảy ra phụ thuộc vào các ảnh hưởng khơng thể dự đốn trước. Một
phép thử thường được lặp lại nhiều lần.
Ví dụ: đo chiều cao, làm xét nghiệm, chẩn đoán bệnh hay điều trị bệnh,…là các
phép thử.
1.2.3

Không gian mẫu ( Outcome spaces hoặc Sample spaces)

Không gian mẫu Ω là tập hợp của tất cả kết quả có thể có của phép thử ngẫu nhiên.
Khơng gian mẫu hay khơng gian mẫu tồn thể, thường được ký hiệu là S, Ω
hay U (tức "universal set").
Ví dụ:

Downloaded by EBOOKBKMT VMTC ()


lOMoARcPSD|2935381

+Để nghiên cứu hiện tượng ngẫu nhiên về sự xuất hiện sấp hay ngửa khi tung một
đồng tiền, không gian mẫu của thí nghiệm đó là tập hợp Ω ={ngửa, sấp}
Đối với một số thí nghiệm, có thể có hai hoặc nhiều hơn khơng gian mẫu.

Ví dụ:
+Trong một cuộc đua ngựa, nếu chúng ta chỉ quan sát người chiến thắng, chúng ta
có thể lấy Ω = { tất cả số con ngựa trong cuộc đua} , khi chúng ta coi người chiến
thắng có thể là một trong những con ngựa có mặt ngày hơm đó.
+ Ngồi ra nếu chúng ta quan sát tồn bộ cuộc đua, chúng ta có thể lấy Ω = {thứ tự
xếp hạng có thể xảy ra}
1.2.4

Biến cố ( Events)

Các tập con của không gian mẫu được gọi là biến cố .

Hình 1. Minh họa tập hợp con
Dựa vào khả năng xuất hiện của hiện tượng chia các hiện tượng thành 3 loại.
A. Biến cố chắc chắn

Downloaded by EBOOKBKMT VMTC ()


lOMoARcPSD|2935381

Biến cố nhất định xảy ra sau phép thử gọi là biến cố chắc chắn, ký hiệu là Ω.
+ Ví dụ: Tung một con xúc sắc, gọi A là biến cố có số chấm nhỏ hơn hoặc bằng 6,
khi đó A là biến cố chắc chắn.
B. Biến cố trống
Biến cố nhất định không xảy ra sau phép thử gọi là biến cố khơng thể có ( biến cố
trống) , ký hiệu là Φ.
C. Biến cố ngẫu nhiên
Biến cố có thể xảy ra, cũng có thể xảy ra sau phép thử. Biến cố ngẫu nhiên thường
được ký hiệu bởi các chữ A, B, C,… hoặc các chữ số kèm theo chỉ số như A1, A2,

B1, B2, C1, C2, C3,…
+ Ví dụ: Nếu gọi Ai là biến cố con xúc sắc xuất hiện mặt có i chấm (i= 1,6 ) thì A1,
A2, A3, A4, A5,A6 là các biến cố ngẫu nhiên.
D. Biến cố bằng nhau
Biến cố A gọi là kéo theo biến cố B nếu A xảy ra thì B xảy ra , ký hiệu là A⊂B
Nếu đồng thời có A⊂B và B⊂A thì các biến cố A và B gọi là bằng nhau.(Huy,
2019)
Ví dụ: Tung một con xúc xắc. nếu gọi Ai là biến cố con xúc sắc xuất hiện mặt có i
chấm (i= 1,6 ), B là biến cố được số nút chia hết cho 3, C là biến cố được số nút
chẵn. P2 là biến cố được số nút nguyên tố chẵn. Khi đó ta có
A2⊂C, A3⊂B

A2⊂P2, P2⊂A2, A2=P2

Từ các định nghĩa, với mọi biến cố A ta có : A⊂Ω, Ω⊂A

Downloaded by EBOOKBKMT VMTC ()


lOMoARcPSD|2935381

Do các quan hệ này nên ta có: Các biến cố trống đều bằng nhau và các biến cố
chắc chắn đều bằng nhau.
E. Quan hệ giữa các biến cố
Cho hai biến cố A và B . Khi đó ta gọi:
i.

Tổng của A và B, hay A cộng B

Là biến cố xảy ra khi A xảy ra hoặc B xảy ra, ký hiệu A+B.

ii.

Tích của A và B, hay A nhân B,

Là biến cố xảy ra nếu A và B đồng thời xảy ra, ký hiệu A.B hoặc AB.
iii.

Hiệu của A và B, hay A trừ B

Là biến cố xảy ra nếu A xảy ra nhưng B không xảy ra, ký hiệu A-B.
iv.

Biến cố xung khắc

Hai biến cố A và B gọi là xung khắc nếu chúng không thể đồng thời xảy ra sau
phép thử. Nói cách khác nếu biến cố A đã xảy ra thì biến cố B khơng xảy ra và
ngược lại, hoặc cả hai biến cố A và B đều không xảy ra sau phép thử.
Như vậy, nếu A và B là hai biến cố xung khắc thì A.B = Φ
+Ví dụ . Tung một con xúc xắc, gọi A là biến cố: “Xuất hiện mặt có chấm số chấm
lớn hơn hoặc bằng 4”, B là biến cố: “Xuất hiện mặt có chấm số chấm nhỏ hơn hoặc
bằng 2”.
Ta thấy hai biến cố và không cùng xảy ra, do đó A và B là hai biến cố xung khắc.
v.

Đôi một xung khắc

Downloaded by EBOOKBKMT VMTC ()


lOMoARcPSD|2935381


Các biến cố A1,A2,…An gọi là đôi một xung khắc nếu hai biến cố khác nhau bất kỳ
trong đó dều là xung khắc, tức là:
Ai.Aj=Φ với mọi i≠j
+Ví dụ: Tung một con xúc sắc
Gọi: Ai = {con xúc sắc xuất hiện mặt có i chấm} (i = 1,6 ) thì A1 và A2 là hai biến
cố xung khắc, A1 và A6 là hai biến cố xung khắc...., A5 và A6 là 2 biến cố xung
khắc, vậy A1, A2, A3, A4, A5, A6 là một hệ gồm 6 biến cố xung khắc từng đôi.
vi.

Biến cố đối lập

Biến cố đối lập của A là biến cố xảy ra nếu A không xảy ra và không xảy ra nếu A
xảy ra, ký hiệu 𝐴 hoặc 𝐴𝑐 . Nếu A và 𝐴 là 2 biến cố đối lập thì A + 𝐴 = Ω và A. 𝐴



+ Ví dụ: Một bà mẹ sinh con, biến cố sinh con trai và biến cố sinh con gái là biến
cố đối lập.
vii.

Nhóm đầy đủ các biến cố

Các biến cố A1,A2,…An gọi là nhóm đầy đủ các biến cố nếu chúng đơi một xung
khắc và ít nhất một trong chúng chắc chắn xảy ra , tức là:
𝐴𝑖 . 𝐴𝑗 = 𝛷 với mọi i ≠ j
{
𝐴1 + 𝐴2 + ⋯ + 𝐴𝑛 = Ω

+ Ví dụ với mọi biến cố A, hai biến cố A, 𝐴 là một nhóm đầy đủ các biến cố.

F. Các phép tốn tập hợp
i.

Phép giao

Downloaded by EBOOKBKMT VMTC ()


lOMoARcPSD|2935381

Giao của hai tập hợp A và B, kí hiệu A ∩ B là tập hợp gồm các phần tử thuộc A và
B, là biến cố xảy ra khi A và B cùng xảy ra.

Hình 2. Biểu đồ Venn thể hiện phép giao
ii.

Phép hợp

Hợp của hai tập hợp A và B, kí hiệu A ∪ B là tập hợp gồm các phần tử thuộc A

hoặc thuộc B, là biến cố xảy ra khi A xảy ra hoặc B xảy ra hoặc A và B cùng xảy
ra.

Hình 3. Biểu đồ Venn thể hiện phép hợp
iii.

Định luật DeMorgan

Downloaded by EBOOKBKMT VMTC ()



lOMoARcPSD|2935381

Cho hai tập hợp bất kì A và B thì
( A∩ B )C = AC U BC
( AU B )C = AC ∩ BC
+ Ví dụ : Rút gọn biểu thức sau sử dụng định luật DeMorgan: 𝑌 = 𝐴𝐵 + 𝐴𝐵

Giải: 𝑌 = 𝐴𝐵 + 𝐴𝐵 = 𝐴𝐵. 𝐴𝐵

Trong đó : 𝐴𝐵 = 𝐴 + 𝐵 = 𝐴 + 𝐵 𝑣à 𝐴𝐵 = 𝐴 + 𝐵 = 𝐴 + 𝐵
 𝑌 = 𝐴𝐵 + 𝐴𝐵 = 𝐴𝐵. 𝐴𝐵 = (𝐴 + 𝐵). (𝐴 + 𝐵)

= 𝐴. 𝐴 + 𝐴. 𝐵 + 𝐵. 𝐴 + 𝐵. 𝐵 = 0 + 𝐴. 𝐵 + 𝐵. 𝐴 + 0 = 𝐴. 𝐵 + 𝐵. 𝐴

1.3 Xác suất

A. Định nghĩa theo suy luận Frequentist:
Định nghĩa theo suy luận Frequentist của xác suất là cách giải thích điển hình của
xác suất bởi nhà thực nghiệm. Theo cách hiểu này, xác suất P (A) chỉ đơn giản là
tần suất xuất hiện tương đối của sự kiện A như được quan sát trong một thí nghiệm
với n thử nghiệm, tức là xác suất của một sự kiện A được xác định là số lần sự kiện
A xảy ra chia cho số thử nghiệm được thực hiện:(M.H.Faber, 2012)
𝑃(𝐴) = lim

𝑁𝐴
𝑣ớ𝑖 𝑛𝑒𝑥𝑝 → ∞
𝑛𝑒𝑥𝑝

Trong đó 𝑁𝐴 là số lần biến cố A xảy ra, 𝑛𝑒𝑥𝑝 là tổng số lần thử nghiệm.


+ Ví dụ: Theo suy luận Frequentist, khi đưa ra xác suất để đạt mặt ngửa khi tung

đồng xu, kết quả sẽ khơng có. Ngoại trừ, khi đã nhận được thêm dữ liệu là sau

Downloaded by EBOOKBKMT VMTC ()


lOMoARcPSD|2935381

1000 lần tung, thì đạt được mặt ngửa là 563 lần thì câu trả lời là xác suất sẽ là
0.563 khi tung ra được mặt ngửa. Tuy nhiên khi tiếp tục tung thì xác suất sẽ dần về
0.5, khi đó ta có nhiều kết quả , rất khó trong việc đưa ra quyết định.Theo định
nghĩa xác suất của Frequentist , chỉ những sự kiện ngẫu nhiên lặp đi lặp lại (như
kết quả của việc tung một đồng xu) mới có xác suất. Trường phái Frequentist phủ
định việc gắn xác suất với các giả thuyết hoặc với bất một giá trị cố định mà chưa
biết trước.(Thống kê suy luận – Hai trường phải triết học, 2019)
B. Định nghĩa cổ điển
Định nghĩa xác suất cổ điển bắt nguồn từ những ngày mà phép tính xác suất được
thành lập bởi Pascal và Fermat(Alsalam, 1998). Giả sử phép thử có n trường hợp
đồng khả năng, trong số đó có m trường hợp thuận lợi cho biến cố A. khi đó ta gọi
xác suất của biến cố A là:(Huy, 2019)
𝑃(𝐴) =

𝑚
𝑛

Như vậy, xác suất của biến cố A là tỷ số về khả năng biến cố xuất hiện.
+Ví dụ:
Tung một đồng tiền cân đối, đồng chất. Gọi S là biến cố được mặt sấp, N là biến cố

được mặt ngửa. Ta có P(S) = ½, P(N) =1/2
Trên thực tế, khơng có mâu thuẫn thực sự với suy luận Frequentist, nhưng có thể
nhận thấy những khác biệt sau:
• Thí nghiệm khơng cần tiến hành vì đã biết trước câu trả lời.
C. Định nghĩa theo suy luận Bayesian
Các suy diễn từ Bayesian cho phép ta cập nhật những suy diễn xác suất khi thay
đổi niềm tin con người, các chứng cứ và thông tin từ dữ liệu:

Downloaded by EBOOKBKMT VMTC ()


lOMoARcPSD|2935381

P(A)= mức độ “niềm tin” mà biến cố A xảy ra
Mức độ niềm tin là sự phản ánh trạng thái tâm trí của cá nhân về kinh nghiệm,
chun mơn và sở thích.(M.H.Faber, 2012)
Trái ngược với suy luận theo Frequentist, Bayesian là trường phái tạo ra sự linh
hoạt trong đo lường khả năng xảy ra của biến cố, nơi mà chúng ta có thể thay đổi
xác suất theo kinh nghiệm một cách linh hoạt thay vì những sự thật tần suất khơ
khan(Khanh, 2021). Ưu điểm của trường phái Bayesian đó là hoạt động hiệu quả
hơn trong các tác vụ dự báo với kích thước mẫu nhỏ.
+ Ví dụ: Tung một đồng tiền cân đối, đồng chất. Gọi S là biến cố được mặt sấp, N
là biến cố được mặt ngửa.Ban đầu bạn thực hiện 3 lần tung và thu được kịch bản là
[S,N,N].
 Theo trường phái Frequentist, Ở lượt tung thứ 4 có q ít bằng chứng để bạn
tin rằng xác suất mặt sấp là 1/3, vì lý do số lượt tung quá ít và đồng xu là
đồng chất.
 Bạn vẫn có niềm tin về tỷ lệ xác suất là cân bằng giữa hai mặt dựa trên phân
tích lý trí rằng đồng xu là đồng chất nên mặt sấp và mặt ngửa có vai trị bình
đẳng. Tổng xác suất của mặt ngửa và mặt xấp là 1 nên xác suất mỗi mặt sẽ là

1/2. Khi đưa ra phỏng đoán về lượt tung thứ 4 bạn không tin xác suất sẽ là
1/3 là một sự thật mà tin vào lý trí khi cho rằng xác suất là 1/2. Đây là suy
luận theo Bayeasian.
D. Định nghĩa xác suất theo tiên đề
Ký hiệu A là tập hợp các biến cố trong một phép thử. Ta gọi xác suất là một quy
tắc đặt mỗi A∈A (Ghahramani, 1999)
(I)

0 ≤ 𝑃(𝐴) ≤ 1, 𝐴 ∈ 𝑨

Downloaded by EBOOKBKMT VMTC ()


lOMoARcPSD|2935381

(II)

𝑃(Ω) = 1, 𝑃(𝛷) = 0

(III) Với mội dãy biến cố đôi một xung khắc (An)⊂A




𝑖=1

𝑖=1

𝑃 (∑ 𝐴𝑖 ) = ∑ 𝑃(𝐴𝑖 )


Tiên đề (I) : Tiên đề xác suất đầu tiên là xác suất của bất kỳ sự kiện nào là một số
thực khơng âm. Điều này có nghĩa là xác suất nhỏ nhất có thể là 0 và nó khơng thể
là vơ hạn. Bộ số mà chúng ta có thể sử dụng là số thực. Điều này đề cập đến cả số
hữu tỉ, còn được gọi là phân số và số vô tỉ không thể được viết dưới dạng phân số.
Một điều cần lưu ý là tiên đề này khơng nói gì về xác suất của một sự kiện có thể
lớn như thế nào. Tiên đề loại trừ khả năng xảy ra các xác suất âm. Nó phản ánh
quan điểm rằng xác suất nhỏ nhất, dành riêng cho các sự kiện không thể xảy ra,
bằng không.
Tiên đề (II) : Tiên đề thứ hai về xác suất là xác suất của tồn bộ khơng gian mẫu là
một. Nói một cách hình tượng, chúng ta viết P ( A) = 1. Ngụ ý trong tiên đề này là
khái niệm rằng khơng gian mẫu là mọi thứ có thể cho thí nghiệm xác suất của
chúng ta và rằng khơng có sự kiện nào bên ngồi khơng gian mẫu.
Tự nó, tiên đề này không đặt giới hạn trên về xác suất của các sự kiện khơng phải
là tồn bộ khơng gian mẫu. Nó phản ánh rằng một cái gì đó chắc chắn tuyệt đối có
xác suất là 100%.
Tiên đề (III) :Tiên đề thứ ba về xác suất đề cập đến các sự kiện loại trừ lẫn
nhau. Tiên đề thứ ba cho rằng đối với một chuỗi các sự kiện loại trừ lẫn nhau, xác
suất xuất hiện của ít nhất một trong số chúng bằng tổng xác suất của chúng.
Mặc dù tiên đề thứ ba này có vẻ khơng hữu ích cho lắm, nhưng chúng ta sẽ thấy
rằng kết hợp với hai tiên đề kia, nó thực sự khá mạnh mẽ.

Downloaded by EBOOKBKMT VMTC ()


lOMoARcPSD|2935381

1.4 Các phép tính xác suất
1.4.1

Xác suất của biến cố đối lập


Với mọi biến cố A, ta có 𝑃(𝐴) = 1 − 𝑃(𝐴)

Chứng minh : Ta có theo tiên đề III và I

P((𝐴 + 𝐴) = 𝑃(𝐴) + 𝑃(𝐴) 𝑚à 𝑃(𝐴 + 𝐴) = 𝑃(Ω) => 𝑃(𝐴 + 𝐴) = 1

+Ví dụ: Tung 2 con xúc xắc. Ta có khơng gian mẫu Ω = {(𝑖, 𝑗): 1 ≤ 𝑖 ≤ 6, 1 ≤

𝑗 ≤6}

Gọi A là biến cố tổng hai mặt bằng 4 => A={(1.3), (2,2), (3,1)}
 P(A)=3/36.

Sẽ rất khó để đếm đủ trường hợp sẽ ra hai mặt có tổng khác 4. Theo định lý của
biến cố đối lặp, P(Ac)=1-3/36=33/36
1.4.2

Định lý cộng xác suất

 Nếu A1,A2,…An là các biến cố đơi một xung khắc thì
𝑃(𝐴1 + 𝐴2 + ⋯ + 𝐴𝑛 ) = 𝑃(𝐴1 ) + 𝑃(𝐴2 ) + ⋯ + 𝑃(𝐴𝑛 )

 Với các biến cố tùy ý A và B, ta có:

Chứng minh:

𝑃(𝐴 + 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴. 𝐵)

Giả sử trong n trường hợp đồng khả năng có thể xảy ra của phép thử:

+ Có m1 trường hợp thuận lợi cho việc xuất hiện của biến cố A, tức là: P(A)=m1/n
+ Có m2 trường hợp thuận lợi cho việc xuất hiện của biến cố B, tức là: P(B) =m2/n

Downloaded by EBOOKBKMT VMTC ()


lOMoARcPSD|2935381

+ Có m trường hợp thuận lợi cho việc xuất hiện cả biến cố A và B, tức là có m
trường hợp thuận lợi cho việc xuất hiện biến cố tích A.B. Do đó P(A.B) =m.n
khi đó số trường hợp thuận lợi cho việc xuất hiện của biến cố tổng (A + B) là:
(m1 + m2 – m).
m1 + m2 – m

Vì vậy P(A+B) =

𝑛

= 𝑃(𝐴 + 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴. 𝐵)

+Ví dụ: Có 400 người trong 1 sự kiện. Trong đó 300 người tham gia đạp xe hoặc
bơi , 160 người bơi và 120 người bơi và đạp xe. Xác suất để chọn ra người tham
gia bơi.
Giải: Gọi A là biến cố người tham gia bơi,B là biến cố người tham gia đạp xe.
Khi đó A+B là biến cố người tham gia đạp xe hoặc bơi
Ta có P(A+B)=300/400, P(A)=160/400, P(AB) =120/400.
Theo định lý: P(B) = P(A+B)+P(AB) –P(A)
= 300/400+120/400-160/400=260/400=0.65
1.4.3


Định lý nhân xác suất

A. Xác suất có điều kiện
Cho hai biến cố A và B. Ta gọi xác suất của biến cố A khi biến cố B đã xảy ra là
xác suất của A với điều kiện B, ký hiệu P(A/B)
+Ví dụ: Giả sử 1 lớp chia làm 3 nhóm thực tập. Nhóm I có 30 sinh viên trong đó
có 10 nữ, nhóm II có 25 sinh viên trong đó có 10 nữ, nhóm III có 25 sinh viên
trong đó có 8 nữ. Chọn ngẫu nhiên trong lớp ra một sinh viên, tìm xác suất để đó là
sinh viên nữ thuộc nhóm 2?

Downloaded by EBOOKBKMT VMTC ()


lOMoARcPSD|2935381

Giải: Gọi B là biến cố sinh viên chọn ra là nữ
A là biến cố sinh viên thuộc nhóm 2
 P(B/A) = 0,4
B. Biến cố độc lập
Hai biến cố A và B đọc lập nếu xác suất của biến cố này không phụ thuộc vào sự
xảy ra hay không xảy ra của biến cố kia, tức là :
𝑃(𝐴 /𝐵) = 𝑃(𝐴) 𝑣à 𝑃(𝐵 /𝐴) = 𝑃(𝐵)

+ Ví dụ: Khi tung 2 đồng xu, rõ ràng đồng xu này có xuất hiện mặt sấp hay không,
cũng không ảnh hưởng tới xác suất để đồng xu kia xuất hiện mặt sấp (hay ngửa).
Như vậy, việc bà mẹ này sinh con trai hay không, cũng không ảnh hưởng tới xác
suất sinh con trai (gái) của bà mẹ khác. Ta đã nhận biết đưuọc các biến cố vừa xét
là độc lập.
C. Định lý nhân xác suất
i.


Với các biến cố tùy ý A và B, ta có:

Chứng minh:

𝑃(𝐴𝐵) = 𝑃(𝐴). 𝑃(𝐴 /𝐵) = 𝑃(𝐴). 𝑃(𝐵 /𝐴)

Giả sử:n là số kết quả có thể có khi thực hiện phép thử,m1 là số trường hợp thuận
lợi cho biến cố A xảy ra ,m2 là số trường hợp thuận lợi cho biến cố B xảy ra, m là
số trường hợp thuận lợi cho cả biến cố A và B xảy ra
khi đó P(A.B) =m/n và P(A)=m1.n

Downloaded by EBOOKBKMT VMTC ()


lOMoARcPSD|2935381

Ta đi tìm P(B/A), với điều kiện biến cố A đã xảy ra rồi thì số kết cục duy nhất
đồng khảnăng của phép thử đối với biến cố B là m1 , trong đó m là kết cục thuận
lợi cho biến cố B xảy ra.
Khi đó theo định nghĩa ta có: P(B/A) =m/m1=
Vậy p(A.B) = p(A).p(B/A)

𝑚/𝑛

𝑚1 /𝑛

= P(A. B)/P(A)

Hoàn toàn tương tự ta cũng có thể chứng minh được p(A.B) = p(B).p(A/B)

+ Ví dụ:
Một tập gồm 10 chứng từ, trong đó có 2 chứng từ khơng hợp lệ. Một cán bộ kế
toán rút ngẫu nhiên 1 chứng từ và tiếp đó rút ngẫu nhiên 1 chứng từ khác để kiểm
tra.
a. Tính xác suất để cả 2 chứng từ rút ra đều hợp lệ.
b. Nếu người đó rút chứng từ thứ ba. Tính xác suất để trong chứng từ rút ra chỉ có
chứng từ thứ 3 khơng hợp lệ.
Giải: Gọi A = {cả 2 chứng từ rút ra đều hợp lệ}.
B = {trong 3 chứng từ rút ra, chỉ có chứng từ thứ 3 không hợp lệ}
Nếu gọi Ai = {chứng từ rút ra lần thứ i là hợp lệ} (i = 1,3). Khi đó ta có :
A = A1 . A2 và B = A1 . A2 . A3
Vì vậy các xác suất cần tìm là:
8

7

P(A) = P(A1 . A2) = P(A1). P(A2/ A1) = . =

.

10 9

28
45

Downloaded by EBOOKBKMT VMTC ()


lOMoARcPSD|2935381


8

7 2

P(B) = P(A1 . A2 . A3) = P(A1). P(A2/A1) . P( 𝐴3 /A1 . A2)= . . =
ii.

10 9 8

Hệ quả

7

45

Nếu A và B là hai biến cố độc lập:

Tổng quát:

𝑃(𝐴𝐵) = 𝑃(𝐴). 𝑃(𝐵)

 Nếu trong một phép thử, các biến cố A1, A2, …, An có thể cùng xảy ra thì:
P(A1. A2. …. An) = P(A1).P( A2/A1)….P(An/A1. A2. …. An-1).
 Nếu các biến cố A1, A2, …, Ak độc lập thì:
P(A1. A2. …. An) = P(A1).P( A2)….P(An)
+ Ví dụ:
Một cơng nhân đứng hai máy hoạt động độc lập nhau. Xác suất để máy thứ nhất,
máy thứ 2 không bị hỏng trong một ca làm việc lần lượt là 0,9 và 0,8. Tính xác
suất để cả 2 máy đều không bị hỏng trong một ca làm việc.
Giải:

Gọi A = {cả 2 máy đều không bị hỏng trong một ca làm việc}
Nếu gọi Ai = { máy thứ i không bị hỏng trong một ca làm việc} (i =1,2), khi đó ta
có: A = A1.A2
Vì vậy xác suất cần tìm là: P(A) = p(A1.A2)
Theo giả thiết A1, A2 là 2 biến cố độc lập với nhau nên ta có:
P(A) = P(A1.A2) = P(A1).P(A2) = 0,72

Downloaded by EBOOKBKMT VMTC ()


lOMoARcPSD|2935381

CHƯƠNG 2. BIẾN NGẪU NHIÊN RỜI RẠC
2.1 Biến ngẫu nhiên rời rạc
2.1.1

Định nghĩa

A. Biến ngẫu nhiên
Giả sử A1,A2,…An là một nhóm đầy đủ các biến cố. Khi đó có một quy tắc X đặt
mỗi biến cố Ai với một số xi(i=1, 𝑛) gọi là một đại lượng ngẫu nhiên. Đại lượng

ngẫu nhiên còn gọi là biến ngẫu nhiên. (Huy, 2019)
+ Ví dụ:

Tung một con xúc xắc. Gọi X là số nút xuất hiện. Khi đó X là đại lượng ngẫu
nhiên. Tập giá trị của X là {1,2,3,4,5,6} nên ta thờng viết:
X={1,2,3,4,5,6}
B. Biến ngẫu nhiên rời rạc (Discrete random variables)
Là biến ngẫu nhiên mà giá trị có thể có của nó lập thành một tập hợp hữu hạn hoặc

đếm được các giá trị. Nói cách khác, ta có thể liệt kê tất cả các giá trị của biến ngẫu
nhiên đó.
+Ví dụ:
Tung một đồng tiền cho đến khi được mặt ngửa thì dừng. Gọi X là số lần tung. Khi
đó X là đại lượng ngẫu nhiên:
X={1,2,…,n}
Đại lượng ngẫu nhiên có dạng:
X={x1,x2,…,xn,…}

Downloaded by EBOOKBKMT VMTC ()


lOMoARcPSD|2935381

Các đại lượng này có các giá trị rời nhau, gọi là đại lượng ngẫu nhiên rời rạc.
2.1.2

Các đặc trưng của biến ngẫu nhiên rời rạc

A. Kỳ vọng (Expectation)
i.

Kỳ vong được sử dụng đầu tiên bởi Pascal nhưng sau này được phổ biến và
trình bày bởi Huygens vào cuối thế kỉ thứ 17.

Cho X là đại lượng ngẫu nhiên rời rạc nhận một trong các giá trị có thể có
x1,x2,…,xn với xác suất tương ứng p1, p2,…pn thì ky vọng của X, ký hiệu là E(X)
được tính theo cơng thức:
𝜇 =E(X)= x1p1+x2p2+….+xnpn+….=∑∞
𝑛=1 𝑥𝑛 𝑝𝑛


Vậy: Kỳ vọng của đại lượng ngẫu nhiên là trung bình theo xác suất các giá trị có
thể nhận cảu đại lượng ngẫu nhiên đó. E(X) là một giá trị trung bình của các xi,
mỗi xi được tính với tỷ trọng pi
+Ví dụ thực tế:(Ghahramani, 1999)
Trong một ván bài casino, xác suất thua 1$ mỗi ván là 0.6, xác suất thắng 1 $, 2$
và 3$ mỗi ván lần lượt là 0.3, 0.08 và 0.02.
Thực tế cho thấy, nếu người chơi chỉ đánh ít ván, người đó phụ thuộc vào may mắn
của mình nhiều hơn bất kỳ kĩ năng nào. Chẳng hạn, khi chơi 1 ván, người đó có thể
thắng 3$ trong khi đang có 60% tỷ lệ thua 1$.
Tuy nhiên , khi chơi nhiều ván, thì tỷ lệ chiến thắng sẽ phụ thuộc vào số lần chơi
nhiều hơn là may mắn. Gọi n là số ván chơi. Xác suất lần lượt là 0.6n cho lần thua
1$; 0.3n,0.08n và 0.02n cho lần thắng 1$, 2$ và 3$.
Ta có: 0.6𝑛 × (−1) + 0.3𝑛 × 1 + 0.08𝑛 × 1 + 0.02𝑛 × 1 = −0.08𝑛

Downloaded by EBOOKBKMT VMTC ()


×